期刊信息

主管单位:中国建筑材料联合会
主办单位:中国建筑材料工业技术情报研究所、中国砖瓦工业协会
编辑出版:《砖瓦世界》杂志社
创刊时间:1984年
开本尺寸:大16开
语言种类:中 文
出版周期:半月刊
邮发代号:2-586
每册定价:30.00元
网  址:zwsjzzs.cn
投稿邮箱:zwsjtgyx@163.com

本刊声明

       凡投稿本刊的稿件,作者文责自负,确保稿件不涉及保密事项,署名无争议。对于以任何形式侵犯他人著作权的行为,作者应独立承担法律责任,本刊概不承担任何连带责任。来稿凡使用,即视为全体著作权人同意将所投稿 件的复制权、发行权、汇编权、翻译权、信息网络传播权转让给本刊杂志社。本社可以将上述权利转授给第三方使用,特此声明!

编辑部公告

通知:敬请各位作者注意,本刊诚征优秀学术稿件,来稿必须为原创稿,不得抄袭和篡改他人作品。凡是投稿本站正在审核期的文章,请勿一稿多投。审稿期限一般二到三个工作日,作者可以随时在本站作者查稿系统中输入文章编号,查询稿件审核情况。

轻量化小模型兴起,中小企业也能搭上AI“快车”

来源:本刊杂志社        点击:        发布时间:2025年07月10日

随着人工智能快速发展迭代,一些企业开始押注小模型。相较大模型,低成本、上线快、易调试的小模型,以更高的性价比为中小企业和个人用户提供了打开人工智能大门的钥匙。近两年,人工智能快速发展迭代,大语言模型如雨后春笋般涌现,文本生成、文生图、语音处理、代码处理、视频处理等生成式人工智能走进人们的生活。同时,一些企业开始发力研发可在电脑、手机端训练的轻量化小模型。

  “我们需要高铁、飞机、游轮等大型交通工具,也需要私家轿车、公交车,以及摩托车、自行车等小型交通工具。因为在不同场景下,不同人群有不同需求。”在青岛自然语义公司联合创始人、首席架构师孙燕群看来,满足特定市场的需求,是专而精的小模型兴起的重要原因及其存在的价值。

  今年3月,自然语义研发的Euler模型通过中央网信办生成式人工智能服务备案。不同于大模型动辄千亿级的参数量,Euler的参数量只有2.5B(25亿),是典型的轻量化小模型。相较于大模型,小模型有何特点?应用前景如何?记者对此进行了采访。

  低成本、易调试的端侧小模型兴起

  关于小模型,目前并没有明确定义。孙燕群表示,在行业内,参数量低于100B的模型就算比较小的模型。在实际应用时,要想在笔记本电脑端实现微调,模型参数量一般在3B左右。

  相较大模型,小模型在算力消耗、使用成本方面更具优势。具体来说,一是训练和推理所需的硬件资源较少,使得成本较低;二是使用更便捷,可在手机、电脑、物联网设备等计算场景中实时运行;三是结构简单,开发者能快速定位问题,易于调试。

  记者了解到,随着大模型的比拼日益激烈,一些企业开始押注小模型。2024年8月,微软和英伟达就相继发布过小型语言模型。国内不少企业也开始研发在“断网、弱网”环境下,让各种智能终端具备自主思考能力的端侧小模型。例如,在今年3月举办的中关村论坛年会期间,北京的面壁智能公司就发布了应用于汽车智能座舱的纯端侧超级智能助手。今年1月,广东佛山移动牵头联合40家单位成立佛山市AI小模型产业联合体,致力于通过人工智能小模型提供个性化服务,助力企业完成智能化升级。

  “小模型让我们实现了与科技巨头们的错位竞争。”提到小模型的具体应用场景,孙燕群举例说,Euler通过备案后,已经开始面向中小企业和个人用户提供服务。如与山东某市级档案馆合作,上线了档案模型;与青岛当地一家仪器仪表设备公司合作,开发了内网技术相关的模型。

  退而求其次后的“主动作为”

  “客观来说,大模型的能力强于小模型,一个参数量2.5B的模型无论如何都不可能超过200B模型的算力。”孙燕群直言,这也是大公司都在做千亿级模型的原因。模型小,神经网络参数就少,容纳的知识量不够,“体现在文本生成上,就是容易出现上下文不连贯的情况”。

  自然语义最初的目标并不是小模型。2019年底,该公司考虑要做大模型,但由于发展方向不明朗,同时在购买高算力GPU上面临资金和货源压力,因此未能实施。

  “没想到,仅过了两年时间,国外的大模型就发布了。”孙燕群回忆说,后来随着越来越多大企业涌入大模型赛道,作为基础硬件的高算力GPU价格水涨船高。“那段时间,听说哪里有GPU,我们就坐飞机去买,常常是提前交了定金也不一定能买到。”最终,公司用10多台设备组成一个算力集群,能支撑做出7B参数的模型。

地址:中国 北京市朝阳区管庄东里甲1号(100024) 北京市海淀区三里河路11号(100831)
您是本站第 位访问者