谷歌正式发布史上最强大模型Gemini 2.0

今天凌晨，谷歌正式发布了为新智能体时代构建的下一代模型——Gemini 2.0。

这是谷歌迄今为止功能最强的AI模型，带来了更强的性能、更多的多模态表现（如原生图像和音频输出）和新的原生工具应用。

Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升，速度甚至达到了后者的两倍。

支持图像、视频和音频等多模态输入与输出，例如与文本混合的原生文生图和可自定义的文本转语音（TTS）多语言音频内容。

此外还支持原生调用工具，如Google搜索、代码执行以及第三方用户定义函数等，为用户提供了更为便捷和强大的功能。

在技术层面，Gemini 2.0采用了最新的机器学习和深度学习算法，提升了神经网络的结构和效率，特别是在自然语言处理（NLP）领域表现出色。

这些技术的创新使得Gemini 2.0能够更好地理解和生成自然语言，增强了人机交互的智能性。

即日起，开发人员便可在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用，而且该版本也已经在网页版中为Gemini Advanced开放试用，移动版后续也将推出。

为了帮助开发者构建动态和交互式应用程序，谷歌还发布了新的Multimodal Live API，具有实时音频、视频流输入以及使用多个组合工具的能力。

明年初，Gemini 2.0还会扩展到更多Google产品中。

Magazine.Subscription.jpg

通知公告

编辑观点

理事会

参考资料

凡《网络安全与数据治理》（原《信息技术与网络安全》）录用的文章，如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明，即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊，本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时，本刊支付的稿酬已包含上述使用的费用，特此声明。

作者投稿

在线期刊

下载中心

信网杯

《网络安全与数据治理》（原《信息技术与网络安全》）编辑部