BLOOM官网,HuggingFace推出的大型语言模型(LLM)
人人都能用的多语种大模型来了!支持59种语言,参数1760亿,1000名科学家联合发起! 一直以来,很多大模型都由造它们出来的大型私营科技公司垄断着。比如GPT-3等,对于普通人来说,再香也只能眼巴巴看着。不过现在,为了给你解馋,由近1000名科学家联合发起的一个志愿项目,耗时一年多炼出了一个号称和GPT-3一样强大的语言模型。它的名字叫BLOOM,参数1760亿,不光支持英文或者中文,连西班牙语、法语等59种语言都支持,是目前最大的多语言开源语言模型。是的,从现在起,从代码到数据集,BLOOM全部对外开放,所有人都可使用。
BLOOM官网: https://huggingface.co/bigscience/bloom
BLOOM参考文档:
https://huggingface.co/docs/transformers/model_doc/bloom
BLOOM是一个BigScience项目,去年5月启动,由Hugging Face主导,收到了700万美元的公共捐款。共有来自全球60个国家、超过250个机构,以及超过1000名研究人员参与其中,其中包括以个人名义参加的Meta、谷歌等大厂员工。它的训练在法国超级计算机Jean Zay上进行,共花费了384块A100 GPU,其中每块有80 GB内存,训练吞吐量约150 TFLOP(该超算由低碳的核能提供动力,释放的热量还用来给学校供暖)。
然而,直到达到102%的时候,BLOOM才正式停止训练。在经过耗时117天的训练后,BLOOM在预定计划时间内顺利完成。
最终,BLOOM具备以下特点:
参数数量达到了1760亿,比GPT-3还多10亿。模型包含70层,每层具有112个注意力头。Token序列长度为2048。采用了GeLU激活函数。使用了总计3416亿条token(1.5TB文本数据)的数据集进行训练。支持13种编程语言和46种自然语言。值得一提的是,对于许多语言而言,如法语、西班牙语和阿拉伯语等,这是首次拥有自己的开源模型(尽管目前尚不支持日语,一些网友已经发现了这一点)。
此外,为了尽量减少生成结果中的偏见,参与项目的人员还经过了一轮人工过滤,对抓取到的数据进行了筛选。
目前,BLOOM的训练对硬件设备有一定要求:
为了保证最佳效果,最好配备8块80GB的A100显卡或16块40GB的A100显卡。
这意味着只有规模稍大的团队才能承担这样的训练需求。
当然,也可以选择在云平台上进行训练,每小时最高费用为40美元。
最后,BLOOM表示将降低使用门槛,并计划开发一个分布式系统,允许实验室之间共享模型。
BLOOM将成为一个不断发展的模型家族,而非一劳永逸的项目。
BLOOM模型已通过 BigScience Workshop 提出了各种版本。BigScience 受到其他开放科学计划的启发,在这些计划中,研究人员汇集了他们的时间和资源,共同实现更高的影响。 BLOOM 的架构本质上类似于 GPT3(用于下一个令牌预测的自回归模型),但已经在 46 种不同的语言和 13 种编程语言上进行了训练。 模型的几个较小版本已在同一数据集上进行了训练。BLOOM 有以下版本:
绽放-560m 绽放-1B1 布鲁姆-1B7 布鲁姆-3B 布鲁姆-7B1 绽放 (176B 参数)官方拥抱面孔和社区(由 表示)
智谱ai,新一代认知智能大模型,最具OpenAI气质和水准”的 AI 公司,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式
APACHE MXNET灵活高效深度学习库,开源深度学习框架
sklearn,Scikit-learn针对Python编程语言的免费软件机器学习库
Lamini,让你低代码快速调教出一个属于自己的大语言模型
BLOOM,HuggingFace推出的大型语言模型(LLM)
阿里巴巴M6,阿里达摩院推出的超大规模中文预训练模型
Qclaw,腾讯电脑管家出品的桌面端AI效率工具,支持微信远程操控电脑,内置Kimi2.5模型,提供5000+Skills生态,本地部署更安全
百度文心智能体平台,基于文心大模型的智能体构建,低成本的开发原生应用!
manus ai,全球首款通用型AI Agent,manus邀请码,内测码如何申请获取?
可以免费使用gemini3 ,claude4.5 GPT5.1等!! flowith,flowith邀请码,画布式的AI工作流,全球首个无限执行智能体
maxclaw,直接集成在MiniMax Agent网页端,实现一键云端部署和7×24小时在线运行
ZeroClaw,ZeroClaw,OpenClaw的极致轻量级替代方案
EasyDL,百度旗下零门槛AI开发平台
天工AI助手,对标ChatGPT的大语言模型
Agent-S,Simular AI 开发的开源代理框架,通过图形用户界面(GUI)实现人机交互的自动化
Dify ai,LLMOps平台,提供AI 聊天机器人,代码转换器,SQL 生成器,新闻内容编写,创意脚本等