• 七角七分博客欢迎大家光临

谷歌AI模型Gemini双子座详解:真的比GPT4强吗?

海外软件 七七 3个月前 (12-10) 0个评论

谷歌刚刚发布了他们最新的AI模型Gemini双子座。因为他们宣传这个新模型的能力比GPT4更强,引起了相当大的轰动。在这期博客里,小编会主要给你介绍以下几个方面的信息:第一,Gemini到底是一个什么样的模型,为什么说它比GPT4更强呢?第二就是现在Gemini能用了吗,我们通过什么方式可以用到?第三个的话是Gemini如果要更强的话,那我们ChatGPT plus的会员是不是就没有必要续费了?然后第四点的话是谷歌对Gemini的最强的一个实操演示,让我们一起来看看就是之后到底有什么可期待的。

谷歌AI模型Gemini双子座详解:真的比GPT4强吗?

Gemini到底是什么模型

首先可以看一下就是Gemini,这个模型的话,它其实是一个从头开始构建的这种多模态的模型。它具有就是处理文本、图像、视频、音频还有代码的这种能力。因为像其他模型的话,就比方说GPT4,它其实很多情况下文本的这个处理能力和图像的处理能力、图像生成能力其实是不同的模型相互拼接在一起的。Gemini的话,就是从多模态开始进行构建的,这个是它的一个很大的特点。Gemini现在发布之后,他们拿出来主要说他能力的一个特点就是他们在一个特别的评分上,MMLU的这个评分上,是超过了人类专家。然后这个评价测试的话,它的分数是比GPT4还要更高的。对在这几项不同的评估上,除了其中一项,就是日常任务的这个常识推理以外,几乎所有的这个评价都是Gemini要强于GPT4。然后前面是关于文字、文本的这种处理的。

谷歌AI模型Gemini双子座详解:真的比GPT4强吗?

除了文本之外,在图像的这个识别和处理上,Gemini也要比GPT4要更强一些。然后在视频的这个处理上,因为ChatGPT没有对应的能力,所以它比较的是别的不同的这个模型。然后在声音的处理上的话,不管是语音的这种自动翻译还是语音的识别,Gemini都要比ChatGPT发布的这个whisper模型要更强。然后他们这里其实同时还提供了一个60页的这个技术报告,你可以自己去进行查看。

然后Gemini的话,现在其实你可以认为就是它不是一个模型,而是三个不同的模型。是分为这三项,就是首先是Ultra,Ultra的话这个是他们最大最强的模型,也是上面就是和去GPT、GPT4进行比较的那个模型。然后Pro的话是属于相对中庸的模型,目前认为就是这个模型跟GPT3.5有点不相上下的意思。然后最后一个的话就是一个Nano模型,这个模型的话主要是用在移动设备上的,它是属于可以离线在机器上运行的。你可以认为就是它的能力比较差,但是好处就是可以离线部署在手机上进行使用。

谷歌AI模型Gemini双子座详解:真的比GPT4强吗?

然后目前也没有一些,前面我测试了一个任务,就是给GPT4发了一张图片,让他解释里面的内容,他能非常清晰的解释就这个图片里到底是什么东西。然后给Bard的话,就是他解释的非常乱七八糟,就完全不知道自己在说什么,他还有非常强的这个幻觉的存在。所以在目前情况下就是你可以用Brad来试一试,但是,如果你现在已经开通ChatGPT Plus会员的话,你会发现Bard可能还不是那么可用。所以我会再期待一下,就是明年年初会发布的这个新的,就是Gemini Ultra的这个模型,就是如果只是Pro这个模型的话,还完全没有办法和GPT4去进行对比。

Gemini VS gpt4

然后我们再来说一下,从现在呈现的信息来说,Gemini是不是真的比GPT4要更强,我们没有必要去续费去GPT plus会员了。我的答案是未必。从我们现在看到的各个信息来看的话,我觉得至少还有几个特点几个方向是我们需要去关心的。就是第一点来说的话,现在大型语言模型的这种评估方法已经相对标准化了,是有可能存在针对这些特定任务有过度优化、过度拟合的这种情况的。但是你用模型其实并不是为了完成就是他测试级的这些任务。所以你在完成你非常个性化的任务时,这个模型的表现可能跟他在评分里表现出来的东西有可能会存在不一致的情况。

谷歌AI模型Gemini双子座详解:真的比GPT4强吗?

另外的话,在一些特定的这个任务上,Gemini和GPT4的评估方法是不一样的。就比方说在最主要的这第一个,就是MMLU的这个比较,你可以看到,Gemini用的是COT的这个方法,所谓COT就是Chain-of-thought思维链的这个方法。而GPT4的话是用的five short,就是用5个示例进行提示的这个方法。这两者方法上其实还是有明显的这个差异的,是存在一定的不公平的。就是如果你用诺贝尔奖得主丹尼尔卡尼曼在《思考,快与慢》这本书里提到的系统二,GPT4在做任务时采用的是系统一的直觉思维,它是直接给答案的。而Gemini在做这部分任务时的话,是用了系统2的缓慢的理性的思考。你可以理解就是他在做任务时比GPT4花了更多时间去思考,所以这两者之间的比较是相对有那么点不合适的。

然后还有一个相当重要的一点,Gemini Ultra目前还处在安全检查的这种阶段。接下来他们会在做就是基于人类反馈的强化学习。然后如果你有印象的话,你会发现就是微软在GPT4正式发布之前其实曾经做过一轮对GPT4能力的测试,当时GPT4表现出来的能力是更强的。但是后来Open AI在安全性上做了越来越多的处理之后,模型能力反而变差了。所以,Gemini到时实际发布出来的版本是不是能跟现在一样好,我其实也还有一层的疑问。

最后第四点就是,大型语言模型除了基本的参数背后所代表的语料知识和逻辑能力以外,实际上能不能访问互联网,能不能使用其他工具,其实都会影响模型的任务表现。然后搭载了Gemini Ultra的Bard,嗯你可以认为就是他短期内还是会缺乏网页浏览、代码解释器,插件这些工具。然后缺了这些工具的话,你可以认为去打一个拿着冲锋枪的海豹突击队的成员,就算泰森更强强壮,然后他的出拳速度更快,但还是打不过一个拿着冲锋枪的人的。虽然我在前面说了非常多的顾虑,但是我依然觉得就是Gemini Ultra这个版本还是非常值得期待的。

最后说明一下,Gemini现在已经是可以使用了的,我们可以通过bard.google.com进行登录使用,不过你需要先有一个gemini账号,我们下期会给大家写一篇关于如何注册gemini账号的教程。

喜欢 (2)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址