小型语言模型:AI领域的新热点

小微 2024年12月18日 阅读:36258

小型语言模型:AI领域的新热点
图片来源于网络,如有侵权,请联系删除

  多年来,谷歌等科技巨头和OpenAI等初创公司,一直在不遗余力地利用海量在线数据,打造更大、更昂贵的人工智能(AI)模型。这些大型语言模型(LLM)被广泛应用于ChatGPT等聊天机器人中,帮助用户处理各种各样的任务,从编写代码、规划行程,到创作诗歌等。

  自ChatGPT面世以来,AI模型便在变大、变强之路上“狂奔”。但喧嚣过后,科技公司也越来越关注更小、更精简的小型语言模型(SLM)。他们认为,这些小巧玲珑的模型不仅“术业有专攻”,而且部署成本更低廉、更节能。

小型语言模型:AI领域的新热点
图片来源于网络,如有侵权,请联系删除

  未来,这些规模不一的AI模型将协同工作,成为人类的左膀右臂。

小型语言模型在简单的专业领域可能更有优势。

  小型模型独具优势

  随着AI技术突飞猛进,AI模型的“块头”与日俱增。ChatGPT的缔造者OpenAI去年夸耀称,其GPT-4模型拥有约2万亿个参数。参数表示AI模型的大小,一般参数越多,AI模型的能力越强,庞大的参数量使GPT-4成为迄今最强大的AI模型之一,能回答从天体物理学到动物学等多领域包罗万象的问题。

  但是,如果某家公司只想借助AI模型解决特定领域(如医学)的问题,或者一家广告公司只需一款AI模型来分析消费者行为,以便他们更精准地推送广告,GPT-4这类模型就有点“大材小用”了,SLM反而更能满足用户们的要求。

  美国《福布斯》双周刊网站在11月的报道中,将SLM称为AI领域的“下一个大事件”。

  微软公司生成式AI副总裁塞巴斯蒂安·布贝克表示,虽然SLM的参数量目前并没有统一标准,但大约在3亿到40亿个之间,小巧到可以安装在智能手机上。

  专家声称,SLM更胜任简单的任务,如总结和索引文档、搜索内部数据库等。

  法国初创公司LightOn的负责人劳伦特·都德认为,与LLM相比,SLM拥有诸多优势:首先,这些模型的反应速度更快,能同时响应更多查询,回复更多用户;其次,SLM部署成本更低,能源消耗也更少。

  都德解释道,目前很多LLM需要大量服务器来进行训练,然后处理查询。这些服务器由尖端芯片组成,需要大量电力来运行,并进行冷却。而训练SLM所需芯片更少,运行耗费的能源也更少,这使其更便宜、更节能。

  SLM还可直接安装在设备上,在不依赖数据中心的情况下运行,这能进一步确保数据的安全性。《福布斯》表示,SLM能以最少的计算资源执行各种任务,使其成为移动设备、边缘设备等的理想选择。

  AI模型掀起“极简风”

  谷歌、微软、元宇宙平台公司以及OpenAI等公司闻风而动,推出了各种SLM。

  去年12月底,微软公司正式发布了只有27亿个参数的语言模型Phi-2。微软研究院在其X平台官方账号上表示,Phi-2的性能优于现有其他SLM,且能在笔记本电脑或移动设备上运行。今年4月,微软又推出了只有38亿个参数的Phi-3系列模型。

  今年8月,微软公司再接再厉,推出了最新的Phi-3.5-mini-instruct。这款SLM为高效、先进的自然语言处理任务量身打造。9月,英伟达公司开源了Nemotron-Mini-4B-Instruct。该公司表示,这款SLM特别适合边缘计算和设备端的应用。报道称,这两款SLM在计算资源使用和功能表现之间实现了良好平衡。在某些方面,其性能甚至可媲美LLM。

  OpenAI也不甘示弱。今年7月,OpenAI公司发布了GPT-4o mini,称其是该公司最智能和最实惠的SLM。

  此外,亚马逊公司还允许在其云平台上使用各种规模的AI模型。

  其他公司也纷纷开发更适合自身需求的SLM。例如,美国制药巨头默克公司正与波士顿咨询集团(BCG)合作开发一款SLM,旨在探究某些疾病对基因的影响。这将是一款参数介于几亿到几十亿之间的AI模型。

  大小模型作用互补

  虽然SLM在效率等方面具有独特优势,但LLM在解决复杂问题、提供更广泛的数据访问方面仍然具有极大优势。

  展望未来,LLM和SLM两种模型将“是朋友而非对手”,它们之间的协作交流将成为主流趋势。

  当遇到用户提出的某个问题时,一款SLM会“一马当先”,理解这个问题,再根据问题的复杂性,将相关信息发送给几个大小不一的AI模型。这些模型“群策群力”“并肩携手”为用户解决难题。

  目前市面上的AI模型要么太大、太贵,要么处理速度太慢。两者合作,或是最佳解决方案。

(记者 刘 霞)

【责任编辑:朱家齐】
    阅读下一篇:
              热门文章
              • 储学军:宣传制造业数字化转型成功经验,讲好数字化转型时代故事

                储学军:宣传制造业数字化转型成功经验,讲好数字化转型时代故事
                图片来源于网络,如有侵权,请联系删除图为储学军出席2024制造业数字化转型发展分享会并致辞  新华网武汉6月28日电(记者凌纪伟)2024制造业数字化转型发展分享会于6月28日在武汉市江夏区举行。分享会是2024企业家江夏行系列活动之一,会上政产学研各领域嘉宾围绕助推制造业数字化转型,培育形成以科技创新为引领的新质生产力分享真知灼见。图片来源于网络,如有侵权,请联系删除  新华网党委书记、董事长储学军出席活动并致辞。他表示,党的二十大报告把加快建设制造强国作为全面建设社会主义...
              • 辽鲁航线海域5G网络全部建成投运——茫茫大海上也能“刷视频”了

                辽鲁航线海域5G网络全部建成投运——茫茫大海上也能“刷视频”了
                图片来源于网络,如有侵权,请联系删除  6月26日,辽鲁航线海域5G网络全部建成并正式投入运行,这是我国首次实现5G网络海上规模化连续覆盖。这意味着,从当日起,乘坐辽鲁航线的旅客将告别手机没有信号或者信号断断续续的历史,在茫茫大海上也可以“刷视频”了。  根据工业和信息化部相关数据,我国已建成全球规模最大的5G网络,覆盖了全国所有地市级、县城城区。珠穆朗玛峰海拔6500米营地,已开通全球最高5G基站;新疆塔里木油田万米深井也实现5G信号全覆盖。  不过,作为我国最大的内海,渤...
              • 7月2日26只个股获券商关注,三花智控目标涨幅达41.57%

                7月2日26只个股获券商关注,三花智控目标涨幅达41.57%
                图片来源于网络,如有侵权,请联系删除每经AI快讯,7月2日,券商给予评级的个股数共有26只,获得买入评级的个股数共有18只。在公布了目标价格的4只个股中,按照最新收盘价计算,预期涨幅排名居前的个股是三花智控(002050.SZ)、瑞鹄模具(002997.SZ)、立讯精密(002475.SZ),预期涨幅分别是41.57%、29.34%、16.4%。 从券商对个股的关注程度来看,有4只个股获得多家券商关注,券商关注数量排名居前的个股是比亚迪(002594.SZ)、长城汽车(...
              • “大陆第一杰伦”全国巡演暂停!入场费最高6000元,座位当晚全部卖完,但不少周杰伦歌迷开始“抵制”他……

                “大陆第一杰伦”全国巡演暂停!入场费最高6000元,座位当晚全部卖完,但不少周杰伦歌迷开始“抵制”他……
                图片来源于网络,如有侵权,请联系删除 每经记者 杜蔚  宋美璐    每经编辑 王月龙 杨夏     “大陆第一杰伦”“不是周杰伦看不起,而是黑伦更有性价比”……靠着这些标签,以模仿周杰伦而走红的“黑伦”近期摇身一变,成了高档酒吧的座上宾,自6月起飞遍国内多市,开起了“演唱会”。图片来源于网络,如有侵权,请联系删除 《每日经济新闻》记者采访获悉,“黑伦”的全国巡演系与...
              • 6月28日十大人气股:中报行情悄然开启

                6月28日十大人气股:中报行情悄然开启
                图片来源于网络,如有侵权,请联系删除6月28日沪深两市涨跌不一,成交量有所放大。板块上消费电子、国防军工涨幅居前,证券、传媒相对较弱。人气股方面领益智造、中国西电、沃尔核材涨停,东方财富、金溢科技跌幅居前。下面是今日十大人气股排名的详细情况。 笔者将从今日人气股中,选择几个有代表性的个股进行点评,希望对投资者有所帮助。 1、东方财富:罕见急跌导致指数走弱 今日券商板块龙头股之一东方财富早盘走势波动不大,午后该股突然跳水,一度跌超8%,收盘前稍有反弹但最终仍跌近7%。...