产品介绍
gemini是一款由google DeepMind(谷歌母公司Alphabet下设立的人工智能实验室)于2023年12月6日发布的人工智能模型,可同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。
首个版本为gemini 1.0,包括三个不同体量的模型:用于处理“高度复杂任务”的gemini Ultra、用于处理多个任务的gemini Nano和用于处理“终端上设备的特定任务”的gemini Pro。
谷歌ai模型的研发进程从2012年就已开始;2022年8月推出高级语言学习模型PaLM;2023年5月google I/O大会上Alphabet首席执行官桑达尔·皮查伊发布了PaLM2与Bard,同时宣布gemini即将问世;12月6日在一段官方公布的视频中,谷歌正式推出gemini。
谷歌计划逐步将gemini整合到其搜索、广告、Chrome等其他服务中。从2023年12月13日开始,开发者和企业客户可以通过google的AI Studio和google Cloud Vertex AI中的gemini API访问gemini Pro。
2023年12月7日,科技界指出gemini与ChatGPT测试方法存疑,且分数存在夸大嫌疑,同时发布会演示视频也存在虚假剪辑问题,随后,对于视频“造假”一说,gemini联合创始人奥里奥尔·维尼亚尔斯予以否认。
2024年2月9日,谷歌宣布gemini Ultra可免费使用,16日发布gemini 1.5,21日发布开源模型Gemma。Gemma采用了与gemini相同的技术和基础架构,基于英伟达GPU和谷歌云TPU等硬件平台进行优化,有20亿、70亿两种参数规模。