什么是预决赛 AI大模型微科普 - 什么叫预训练

小编 23 0

AI大模型微科普 - 什么叫预训练

定个30天的目标,尽量用通俗易懂的语言,给大家讲明白AI大模型,欢迎关注。

上篇讲到大语言模型名称概念,这篇我们按照大模型的训练顺序,首先介绍下预训练,如果对AI关心的非技术人员肯定会经常听到:“预训练”、“监督学习”、“后训练”等名词,既然我们文章的定位是通俗科普,那么我会尝试尽量少用公式,多用直白的口语进行介绍。

预训练就像是给大语言模型上一门基础课。在这门课中,模型会被喂入大量的通用型数据,包括书籍、文章、网页等等,甚至你日常发表的心情文章,灌水的帖子,网络吵架的对话之类都是预训练中大模型学习的一部分,让它学习这些数据的一般规律,这个过程不需要特定的任务指导,也被称为无监督的学习方式。

模型就像在探索世界一样,学习人类语言的基本结构,尝试抓住语言中的模式,例如单词如何组合,句子如何表达意思等。

什么是预决赛 AI大模型微科普 - 什么叫预训练

可以想象一下,如果我们要训练一个足球队,我们不会直接让他们去踢正式的比赛,而是先让他们进行基础训练,比如跑步、传球、射门等。这样,当他们真正上场比赛时,就能更好地协作,发挥出更好的水平。预训练模型也是类似的,先让模型学习一些基础的知识,再让它去解决具体的问题。

什么是预决赛 AI大模型微科普 - 什么叫预训练

通过预训练,模型能够在没有针对性训练的情况下,也表现出一定的智能和理解能力,OpenAI 前首席科学家 Ilya Sutskever 在公开采访中指出大规模预训练本质上是在做一个世界知识的压缩 ,从而能够学习到一个对人类世界知识编码后的参数模型,这个模型能够通过对话的方式,解压缩所需要的知识来解决真实世界的任务。

这也是为什么我们会说大模型是一个理科生造出来的文科生,在文本润色、文章生成(比如写诗、写营销文案)方面更加出色,但是在做数学题方面很弱,面临简单的加减法,尤其当数字越大时,它的准确性就越差,因为正确答案在网络上找不到,不会有很多网站包含“6587+253”这类的算式。但是随着技术的发展,这类逻辑计算型的工作,已经有了较为先进的解决方案,比如借助外部的计算器接口,让大模型调用工具进行计算,这些在后面文章会详细介绍。

什么是预决赛 AI大模型微科普 - 什么叫预训练

拓展阅读:

我们通常认为可以通过一个人的语言表达来了解一个人的三观,互联网产生后,人类在其中表达了无数的文字,并且把人类历史上所沉淀的所有知识,都做了数字化存储,这些共同构成了大模型的“三观”。

从上面的文章我们了解到大模型就像照相机一样,在照相机发明之前,人们都通过画家来帮助记录,但是没有因为照相机的出现,画家这个职业就消失,当前的画家可以将注意力集中在真正有创意的部分,发挥人类不可替代的部分;

同样的,大模型也不会让作家消失,它可以帮助作家更好的进行写作训练,如果一个人从来没有写过人们都读过的文章,他们就永远不会获得写人们从未读过的东西所需的技能

视频首届湖南省林业系统森林消防队伍业务技能大赛——预决赛精彩集锦

视频加载中...

新湖南客户端6月1日讯(记者 陈龙)为全面提升森林防灭火能力,守护好绿水青山,5月30日,首届湖南省林业系统森林消防队伍业务技能大赛预决赛在长沙举行。大赛由湖南省林业局主办,长沙市林业局协办。全省各市州初赛第一名的队伍组成14支代表队,280名一线森林消防队员参加比赛。

经过多番激烈角逐后,一共有怀化市代表队、邵阳市代表队、长沙市代表队、衡阳市代表队、益阳市代表队、岳阳市代表队共6支代表队拿到了5月31日决赛的入场券。在这里,让我们一起欣赏预决赛那些精彩的瞬间!