大模型刮起开源风!九款GPT4平替已开源!-焦点快看
作者 | 徐杰承
审校 | 云昭
(资料图)
51CTO读者成长计划社群招募,咨询小助手(微信号:TTalkxiaozhuli)
OpenAI借助ChatGPT所点燃的大语言模型(LLM)之火已在全球范围内燃烧了4个月有余,而在此期间,OpenAI与微软所推出的一系列基于GPT3.5或GPT4模型的AI产品也纷纷在不同领域取得了亮眼的表现。
然而令人略感失望的是,作为如今LLM圈内绝对的领头羊,OpenAI并没有遵从其创立初衷,无论是ChatGPT早期所使用的的GPT3、GPT3.5还是此后推出的GPT4模型,OpenAI都因“暂无法保证其不被滥用”为由拒绝了对模型开源,开启了订阅付费模式。
对于大型科技企业而言,不管是出于秀肌肉还是出于商业竞争目的,自研LLM都是一条几乎无可避免的道路。但对于缺少算力和资金的中小企业以及希望基于LLM开发衍生产品的开发者来说,选择开源显然是更理想的一条路线。
那么就目前来看,在LLM领域,都有哪些优质的开源模型可供选择?开源与闭源的运作模式又会对模型的迭代产生哪些影响呢?本文将带你一睹LLM圈优质开源模型的最新信息。
1、Meta:LLaMA,生态发展蓬勃几周前,MetaAI推出了大语言模型LLaMA,其不同版本包括70亿、130亿、330亿和650亿的参数,虽然比GPT3还小,但LLaMA在许多任务上的性能都能够追平甚至超越GPT3。
更值得注意的是,作为体量更小的模型,LLaMA不需要太多资源就能流畅运行,且LLaMA的训练成本及训练速度都要优于GPT3.5。
而有趣的是,LLaMA起初并未开源,但在发布后不久,模型便在4chan论坛上泄露了。然而这个乌龙事件却也使LLaMA因祸得福,在“被迫”开源后,LLaMA引发了大量开发者的关注,基于其构建的模型也如雨后春笋般诞生。这场本应是不幸的事情也使得LLaMA成为了如今LLM领域最具影响力的创新来源之一。
项目地址:github.com/facebookresearch/llama
2、斯坦福大学:Alpaca,性价比拉满Alpaca是斯坦福大学通过Meta的LLaMA 70亿微调而成的全新模型,仅使用了52k数据,但其性能却基本达到了GPT3.5的水平。而Alpaca的关键优势则在于低到出奇的训练成本——仅需不到600美元。
斯坦福大学的研究人员表示,Alpaca表现出了许多类似于OpenAI的GPT3模型的行为,但相比于GPT3,Alpaca的体积更小且各项能力更易于重现。
截至目前,斯坦福团队已在GitHub上开源了Alpaca模型微调所用到的数据集和代码,并提供了一个在线演示网站供用户体验。数据集包含了5.2万个由OpenAI API生成并人工筛选过后的问题-答案对。代码则基于华盛顿大学去年提出的Self-Instruct方法,让AI自己从种子任务中组合出新任务,并生成相应答案。
项目地址:https://github.com/tatsu-lab/stanford_alpaca
3、Databricks:Dolly2.0,全开源可商用没错,这个模型正是借用了克隆羊Dolly的名字。4月12日,Databricks发布了Dolly 2.0大型语言模型。Databricks表示,Dolly2.0是业内第一个开源、指令跟随型LLM,其在透明免费的数据集上进行微调,可用于研究和商业用途。此外,Databricks还发布了Dolly 2.0在其上进行微调的数据集,称为databricks-dolly-15k。
作为Dolly模型的升级版,Dolly2.0使用了基于 EleutherAI的Pythia模型家族中的120亿参数语言模型。虽然由于参数量和数据限制,Dolly2.0的综合性能表现略逊于同类型大模型,但对大部分开发者而言也已经足够了。并且Dolly2.0完全开源及可商用的属性,使其顺理成章的成为中小企业及个人开发者的福音。
项目链接:https://huggingface.co/databricks/dolly-v2-12b
4、Hugging Face:BLOOM,体量惊人BLOOM是去年由1000多名志愿者在一个名为BigScience的项目中创建的,该项目由AI初创公司Hugging Face利用法国政府的资金运作的。BLOOM拥有1760亿参数,研究人员表示它提供了与GPT3模型相似的准确性和有毒文本生成水平。
作为目前体量最大的开源大型语言模型之一,BLOOM的训练集包含45种自然语言(含中文)和12种编程语言,1.5TB的预处理文本转化为了350B的唯一token。实验证明BLOOM在各种基准测试中都取得了有竞争力的表现,在经过多任务提示微调后也取得了更好的结果。
项目地址:huggingface.co/bigscience/bloom
5、阿卜杜拉国王科技大学MiniGPT4,图像对话能力可观MiniGPT4是近期由沙特阿拉伯阿卜杜拉国王科技大学研究团队推出的一款全新开源模型。据研究人员透露,MiniGPT4具有许多类似于GPT4的功能。除了可执行复杂的视觉语言任务外,MiniGPT4还拥有与GPT4相似的图片解析功能。
研究团队所发布的论文显示,为了构建MiniGPT4,研究人员使用了基于LLaMA所构建的Vicuna作为语言解码器,并使用BLIP-2视觉语言模型作为视觉解码器,且由于使用开源软件的缘故,MiniGPT可以用较少的数据和费用进行训练和微调。虽然由于模型发布较晚,该模型相关测评并未公布,但据GitHub显示,目前该研究团队已将MiniGPT的代码、预训练模型和数据集进行了开源。
项目地址:github.com/Vision-CAIR/MiniGPT-4
6、Stability AIStableLM,万亿token训练4月19日,Stability AI发布了一个新的开源语言模型——StableLM。该模型的Alpha版本有30亿和70亿参数,后续还会推出150亿和650亿参数的版本。根据CC BY-SA-4.0许可证的条款,开发人员可以出于商业或研究目的自由检查、使用和修改我们的StableLM基本模型。
据官方介绍,StableLM的构建基于非盈利研究中心EleutherAI所开源的多个语言模型,包括GPT-J,GPT-NeoX等,该模型在The Pile基础上构建的新数据集上进行训练,该数据集包含 1.5 万亿个token。可支持4096的上下文宽度,且RL调试模型可用。
但值得注意的是,该模型并为发布基准测试,也没有发布有关模型的详细信息,其基本型号上也存在一些限制性许可证。并且StableLM会抓取ChatGPT的输出内容,这会违反OpenAI的使用条款,OpenAI有权在收到通知后终止用户的访问。因此,在进行商用时,该模型依然存在一定的潜在风险。
项目地址:github.com/Stability-AI/StableLM/issues
7、元语智能ChatYuan,首个中文开源对话模型作为首个中文版开源对话模型,元语智能ChatYuan大模型自发布以来便在人工智能社区引发了广泛的讨论。而在近期,元语智能团队再次开源了一个全新ChatYuan系列大模型:ChatYuan-large-v2。
据介绍,ChatYuan-large-v2支持在单张消费级显卡、PC甚至手机上进行推理使用。新版本支持中英双语、支持输入输出总长度最长4k,这也是继此前PromptCLUE-base、PromptCLUE- v1-5、ChatYuan-large-v1模型之后,元语智能的再一力作。
技术方面,ChatYuan-large-v2使用了和v1版本相同的方案,并在指令微调、人类反馈强化学习、思维链等方面进行了优化。作为ChatYuan系列模型中的代表,ChatYuan-large-v2仅通过7亿参数量可以实现业界100亿参数模型的基础效果。
项目地址:https://github.com/clue-ai/ChatYuan
8、清华大学ChatGLM,开辟小而精方向ChatGLM是由清华技术成果转化的公司智谱AI开发的开源、支持中英双语的对话语言模型,基于GeneralLanguageModel(GLM)架构研发,拥有62亿参数,支持在单张消费级显卡上进行推理使用,在保障平民消费能力的情况下,具有小而精的特点。
ChatGLM当前版本模型的能力提升主要来源于独特的千亿基座模型GLM-130B。其不同于BERT、GPT-3以及T5架构,包含多目标函数的自回归预训练模型。研发团队参考了ChatGPT的设计思路,为ChatGLM在基座模型GLM-130B中注入了代码预训练,通过有监督微调等技术实现人类意图对齐。
从具体数据及测试表现来看,ChatGLM具备兼具双语能力;易微调、部署门槛低;支持长对话与应用以及内容输出格式简单等优势。但由于模型容量较小,ChatGLM也不可避免的存在着模型记忆和语言能力较弱;可能产生错误内容和多轮对话能力不足等一些缺点。
项目地址:github.com/THUDM/ChatGLM-6B
9、昆仑万维天工系列模型,新模型实现智能涌现去年年底,昆仑万维发布了昆仑天工系列模型并宣布模型开源,包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,分别涉及AI图像、AI音乐、AI文本、AI编程方面,目前已经有中国移动、咪咕等企业测试使用。
而就在近日,昆仑万维再次发布了最新迭代升级的大语言模型天工3.5。据官方表示,天工3.5是第一个实现智能涌现的国产大语言模型,已“非常接近ChatGPT的智能水平”,可满足文案创作、问答、代码生成、逻辑推理与数理推算等需求。
10、大模型时代:开源vs闭源PC时代,Linux打破了Wintel联盟的垄断;在iOS的封闭生态和Android的准封闭生态下,开源RISC-V实现了异军突起。开源从始至终都意味着自由开放、意味着全球开发者能够同时贡献和维护所带来的迭代效率与风险控制。
在大模型时代,开源与闭源的问题被再次搬上桌面。从短期角度讲,无论是出于安全性、版权问题还是商业竞争的考量,OpenAI或是其他拥有大模型的科技企业选择闭源都无可厚非。但从长期角度出发,对于每个大模型以及整个领域的发展而言,开源生态所带来的帮助势必将超越企业本身。
回首往昔,Linux的成功,并不是依靠技术的先进性击败了其他操作系统,而是借助蓬勃的开源生态在激烈的市场竞争中占据了主导地位。而这样的故事在今天或是未来是否依然会继续发生,就让我们一起拭目以待。
标签:
推荐
- 大模型刮起开源风!九款GPT4平替已开源!-焦点快看
- 播种、赏花、做椿饼……天府十二幼萌娃“邂逅”谷雨
- 一季度北京居民人均可支配收入21367元,同比增3.6%_天天讯息
- 世界杯前23场12球10助,世界杯后18场3球3助,穆西亚拉怎么了?
- 世界热资讯!刘诗诗麻花辫运动装青春元气 透露自己想去户外露营
- IMF首席经济学家:世界分裂为竞争集团代价巨大 热讯
- 每日速讯:被拍到与抗议者在一起,巴西总统府安全负责人辞职
- 俄媒:乌克兰农产品即将恢复过境波兰
- 日媒:2022年日本贸易逆差21.7万亿日元 创新高
- 中国新能源汽车制造海外竞争力提高 成为智能制造新名片-天天热文
- ETF观察丨国家发改委五方面发力壮大数字经济,景嘉微涨超5%,数字经济ETF(159658)溢价交易:全球热门
- V观财报|步步高下修业绩收关注函:主业盈利能力持续较弱啥原因?-全球最资讯
- 苦乐一辈子,话说聚散100万:即时看
- 蜂巢能源为融合聚能提供储能电池 助力美的绿色低碳工厂建设-实时焦点
- 【天天聚看点】《往日不再》只是预警:Steam多款索尼第一方国区涨价
- 环球关注:冯远征:建议年轻演员增加阅读量
- 冯远征:文艺工作者要有使命感 独家
- 特朗普或不就“封口费”民事案出庭受审 法官要求说明情况
- 【国际漫评】拥枪教育从娃娃抓起?_世界热资讯
- 美高校研究:贫困已成为美国人第四大死因_世界热议
- 是你让我看见干枯沙漠开出花一朵表情包(是你让我看见干枯沙漠开出花一朵)|当前讯息
- 蛇和什么属相最配_属蛇的人与哪些属相合适:环球今日讯
- 2023年二级建造师《市政工程》每日测试题(04月19日)
- 新车首次亮相+全系车型入华!捷尼赛思发力中国市场
- 天天热推荐:国家发改委:加快建设沪苏湖铁路、通苏嘉甬铁路 高效推进轨道上的长三角建设
- 大风蓝色预警!预计今天夜里到明天白天,江苏多地最大风力可达8级左右
- 【天天播资讯】亚洲文化遗产保护联盟大会将在西安召开
- 美国会一委员会报告认为中国一些电商平台存在数据风险问题,商务部回应
- 商务部:美方报告多次使用“或许”“可能”等表达指责中国电商平台,不专业不负责任 天天速递
- 南亚及东南亚多国出现极高温天气 新要闻
- 俄媒:消息人士称,俄核潜艇将继承“彼得大帝”号巡洋舰名号-天天观察
- 4.19收评|还有爆发潜力|天天热点
- 这条赛道,国产化率不足2%
- 高考语文如何考分130_天天滚动
- 一季度北京市固定资产投资(不含农户)同比增长9.6%
- 许家印召开恒大足球管理会议 提出16字新广州队精神|今日精选
- 《死搁》硬汉演员参演《星战幸存者》:荣幸参与其中 看热讯
- 连续11个跌停 昔日“大数据第一股”*ST中昌跌创新低
- 色素辣椒移栽忙 致富又添新出路-热点评
- 焦点速看:#男子单手插兜舞剑接打乒乓球#
- 全球球精选!索朗曲扎:戍守西藏阿里典角村,“我就是这里的监控探头”
- 土旦次旺:西藏普兰中尼边境线上的“翻译官”
- 特朗普集团前CFO出狱:曾犯15项税务欺诈罪 认罪后遭东家斥责_全球观察
- 新华社权威快报|春耕备播进展顺利 夏季粮油丰收有基础
- 鼓励民间资本参与重大项目建设 加快落实各项建设条件
- 起诉离婚后,开庭的时候被告没到庭,法院说缺席判决,过了一段时间法院给我
- 常德最低社保交多少钱一个月 2023年常德个人社保缴费标准一览
- 超卓航科2022年净利5908.6万 董事长李光平薪酬23.1万
- 【环球热闻】启明星辰2022年净利6.26亿元,保持业内领先的盈利水平
- 三年来澳大利亚首个商业代表团将访华?商务部:中方欢迎
- 商务部:中澳正就澳大利亚贸易部长访华具体安排保持密切沟通
- 日本国会收到炸弹威胁 威胁邮件称“21日下午开始大屠杀”
- 外媒:美战斗机在阿拉斯加附近伴飞两架俄轰炸机 微速讯
- 海外网评:敲错门竟遭枪击,美国社会“人人自危”
- 天天热头条丨热搜!五一放一天假你接受吗?83万人中,46万人选择“能”
- 天天看热讯:国联水产益阳工厂2023年小龙虾收购工作启动
- “火烧”长峰医院:虚假广告、竞价排名 花数亿元营销却连年亏损
- 海南三沙海警局查获非法捕捞渔获物320000余斤
- 龙卷风袭击美国俄克拉荷马州 至少两人死亡
- 台北101大楼遭雷击瞬间曝光:紫光乍现照亮全城 民众惊叹
- 当前消息!俄副外长:去美元化是一种趋势 近些年开始加速
- 多模态AI技术「涌现」,AI公司的「新机会」
- 信息:研究:1/4美国学生滥用多动症药物提高成绩 恐导致抑郁辍学
- 世界快讯:一拳暴击坏蛋的「韩国队长」马东锡,又带着《犯罪都市3》回来啰
- 全球新消息丨壹石通(688733)4月20日主力资金净卖出571.17万元
- 当前短讯!“材料之王”新突破!石墨烯制成迄今最薄心脏植入物
- 环球滚动:福晶科技4月20日快速回调
- 股市大盘股启动说明什么?投资大盘股的技巧有哪些?
- 股票公开增发指的是什么?公开增发的股票走势如何?
- 全球热点!武汉经开农发筑牢抵制酒驾醉驾违法违纪行为防线
- 孟晚舟当值华为轮值董事长后首次亮相 谈华为数字化战略
- 动态焦点:韩国最大在野党要求总统撤回暗示向乌克兰提供武器支援的发言
- 去年韩国电信诈骗案被骗资金退还率不到三成,受害者年龄越高涉案金额越大
- 焦点速看:会馆有戏 大家云集——正乙祠戏楼正式面向社会公众开放
- 成都式“跨境抢单”出圈之后 如何实现世界流量的快速转化?
- 快报:泰国“国际中文日”系列活动举办
- 子代策略|今日热搜
- 环球微动态丨三原县气象台发布大风蓝色预警【Ⅳ级/一般】
- 环球快资讯:嬼
- 轻舟智航首发基于环视相机的6V1R高速NOA并开放体验
- 当前快报:文彬在妈妈20日生日前一天自杀身亡 面对丧子之痛令人鼻酸
- 关注:4月19日中化弘润油品报价暂稳
- 今年京密路、安立路等多条通道将推进快速化改造_当前热议
- 天天资讯:贫困!美国人第四大死因
- 台湾17岁少年街头疯狂扫射42枪:投案后仅称"心情不好" 现场曝光_当前焦点
- 俄媒:“死神”坠毁后,美国“全球鹰”已停止前往黑海:环球消息
- 焦点播报:中国维和医疗分队在黎巴嫩南部边境开展巡诊活动
- 赤道几内亚已有11人因感染马尔堡病毒死亡:焦点简讯
- 济南槐荫区:“家住槐荫,‘育’见成长”主题教育活动为青少年打造“成长云地图”
- 爱媛什么品种最好?-天天看点
- 摩托车网红:性感酷炫 也致命危险
- 每日简讯:市州观察丨彭山区建立“四项机制” 促选调生投身“天府粮仓”建设
- 热头条丨调查问卷法怎么写_调查问卷法
- 天天观天下!怀孕发现是葡萄胎,到底是什么情况?
- 当前热议!一名剑侠客转换成龙太子再转换成杀破狼的小说_一名剑侠客转换成龙太子再转换成杀破狼
- 曾逃离北上广深的年轻人又回来了:有自由精神空虚 钱也少了|世界观焦点
- 共话中国经济新机遇丨综述:中国企业和投资者在加蓬收获好评
- 轻工业数字化水平加快提升_今日热讯
- 第133届广交会第一期入场超126万人次:微头条
- 全国已春播粮食面积超1.6亿亩 进度近两成:天天快讯
X 关闭
政策法规
X 关闭