Gemini

AI聊天对话机器人

gemini是一款由google DeepMind（谷歌母公司Alphabet下设立的人工智能实验室）于2023年12月6日发布的人工智能模型，可同时识别文本、图像、音频、视频和代码五种类型信息，还可以理解并生成主流编程语言（如Python、Java、C++）的高质量代码，并拥有全面的安全性评估。

首个版本为gemini 1.0，包括三个不同体量的模型：用于处理“高度复杂任务”的gemini Ultra、用于处理多个任务的gemini Nano和用于处理“终端上设备的特定任务”的gemini Pro。

谷歌ai模型的研发进程从2012年就已开始；2022年8月推出高级语言学习模型PaLM；2023年5月google I/O大会上Alphabet首席执行官桑达尔·皮查伊发布了PaLM2与Bard，同时宣布gemini即将问世；12月6日在一段官方公布的视频中，谷歌正式推出gemini。

谷歌计划逐步将gemini整合到其搜索、广告、Chrome等其他服务中。从2023年12月13日开始，开发者和企业客户可以通过google的AI Studio和google Cloud Vertex AI中的gemini API访问gemini Pro。

2023年12月7日，科技界指出gemini与ChatGPT测试方法存疑，且分数存在夸大嫌疑，同时发布会演示视频也存在虚假剪辑问题，随后，对于视频“造假”一说，gemini联合创始人奥里奥尔·维尼亚尔斯予以否认。

2024年2月9日，谷歌宣布gemini Ultra可免费使用，16日发布gemini 1.5，21日发布开源模型Gemma。Gemma采用了与gemini相同的技术和基础架构，基于英伟达GPU和谷歌云TPU等硬件平台进行优化，有20亿、70亿两种参数规模。