近年来人工智能(AI)和深度学习(Deep learning)技术飞速发展,极大改变了我们日常的学习、工作与生活。伴随人类社会数字化和信息化产生的海量数据,人工智能技术能够有效学习数据的分布与特征,对数据进行深入分析并完成复杂的智能任务,产生巨大的经济与社会价值,人类社会步入了“大数据时代”。
当前人工智能算法的典型流程为:准备数据、训练模型和部署模型。其挑战在于,针对给定的任务,人工标注训练数据注费时费力,数据规模通常有限,需要承担算法性能不达标、模型泛化能力差等诸多风险,导致人工智能应用面临研发周期长、风险大、投入成本高的困局,阻碍了人工智能算法的落地与推广。
2018年预训练语言模型技术被提出,形成了“预训练-微调”的新型研发范式,极大地改变了上述困局。在这个新范式下,我们可以非常容易地搜集大规模无标注语料,采用自监督学习技术预训练语言模型;然后再利用特定下游任务对应的训练数据,进一步微调更新模型参数,让该模型掌握完成下游任务的能力。大量研究结果证明,预训练语言模型能够在自然语言处理等领域的广大下游任务上取得巨大的性能提升,并快速成长为人工智能生态中的基础设施。
通过充分利用互联网上的海量数据,预训练模型正在引发一场人工智能的性能革命。研究表明,更大的参数规模为模型性能带来质的飞跃。对十亿、百亿乃至千亿级超大模型的探索成为产学研界的热门话题,引发国内外著名互联网企业和研究机构的竞相跟进,将模型规模和性能不断推向新的高度。除Google、OpenAI等国外知名机构外,近年来国内相关研究机构与公司也异军突起,形成了大模型的研究与应用热潮,人工智能进入“大模型时代”。
然而在“大模型时代”,因为大模型巨大的参数量和算力需求,在大范围内应用大模型仍然存在着较大的挑战。如何让更多开发者方便享用大模型,如何让更多企业广泛应用大模型,让大模型不再“大”不可及,是实现大模型可持续发展的关键。
基于此,浪潮源1.0大模型开源了向人工智能应用开发者群体进行开放,开放内容包含开放模型API,开放高质量中文数据集,开源模型训练代码、推理代码和应用代码等。
开放平台:https://air.inspur.com/,可进行模型API、中文数据集的申请使用。
开发者社区:https://github.com/Shawn-Inspur/Yuan-1.0,可浏览训练代码、推理代码和应用示例代码。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)