技术创新研究所(TII)今天宣布,阿联酋首个大型人工智能模型“Falcon40B”现已开源,用于研究和商业用途,从而加强了其在人工智能领域日益增长的国际影响力。
这一开创性举措表明,阿布扎比致力于促进跨部门合作,推动生成式人工智能的发展。
Falcon是一种基础大型语言模型(LLM),拥有400亿个参数,使用1万亿个代币进行训练,为研究人员和中小企业(SME)创新者提供了前所未有的访问权限。
技术创新研究所是全球领先的科学研究中心,也是阿布扎比先进技术研究委员会(ATRC)的应用研究支柱,它提供了一个更全面的开源软件包来访问该模型的权重,目的是使人们能够访问强大的法学硕士功能,促进透明度和问责制,并支持该领域的创新和研究。
在当前的人工智能生态系统中,开发人员发现,提供模型权重访问的llm更具吸引力,因为它们提供的微调功能比没有的llm更强。
虽然大多数LLM只向非商业用户授予独家许可,但TII在向研究人员和商业用户提供Falcon 40B LLM方面迈出了关键一步。
随着Falcon40B作为开源模型的发布,TII发起了一项提案征集,邀请那些热衷于利用基础模型潜力的科学家、研究人员和有远见的人。
我们鼓励他们贡献自己的创新想法,并利用该模型来构建鼓舞人心的用例,或探索其应用程序的进一步可能性,以覆盖工程、医疗保健、可持续性、编码等领域。
作为对特殊研究建议的激励,选定的项目将以投资的形式获得“训练计算能力”,使创新者能够利用强大的计算资源来加速数据分析、复杂建模和新发现。
这种支持将培育和加速新想法的发展,提供必要的资源,将它们转化为具有商业可行性和社会效益的有影响力的人工智能解决方案。
VentureOne是ATRC的商业化部门,将促进计算能力,使最具创新性的解决方案产品化。
ATRC秘书长Faisal Al Bannai表示:“使Falcon40B开源是我们致力于促进人工智能创新的一个关键里程碑。”
“我们正在打破LLM的准入,使研究人员和企业家能够提出最具创新性的用例。我们将通过VentureOne以计算能力作为资金进一步支持这些提交,帮助推动蓬勃发展的研究生态系统。”
Falcon号于2023年3月首次亮相,展示了卓越的性能,凸显了阿联酋对技术进步的承诺。
基于斯坦福大学的HELM LLM基准测试工具,猎鹰40B在使用更少的训练计算能力方面优于其著名的同行。
该工具仅占OpenAI GPT-3训练计算的75%,DeepMind Chinchilla人工智能的40%,谷歌PaLM-62B训练计算的80%,证明了TII致力于推进生成式人工智能发展的承诺。
TII首席执行官Ray O. Johnson博士表示:“计算能力在加速人工智能系统培训和更快地实现用例方面发挥着关键作用。作为推动技术创新的新燃料,提供这样的支持将改变游戏规则,增强创新者的能力,使他们能够突破项目的界限,取得显着的进步。”
Falcon40B是由TII的人工智能和数字科学研究中心(AIDRC)领导的一项突破。去年,该团队还推出了世界上最大的阿拉伯NLP模型NOOR,并将很快开发和发布Falcon180B。
TII人工智能跨中心部门主任Ebtesam Almazrouei博士说:“Falcon40B、7.5B和13B参数人工智能模型的开源发布以及我们高质量的REFINEDWEB数据集,体现了阿联酋深刻的科学贡献。随着每一次突破,我们都将挑战限制,重塑可能性领域,为具有变革性影响的合作努力铺平道路。”
阿联酋最近上升了5位,成为阿拉伯国家中排名最高的国家,在联合国2023年前沿技术准备指数的166个国家中排名第37位。作为一长串进步技术里程碑的补充,开源生成人工智能模型将提升阿联酋作为主流人工智能参与者的资格。
要访问Falcon AI模型或提交用例请求提案,用户可以访问FalconLLM.TII.ae。迄今为止,Falcon llm是开源的,将在基于开源Apache 2.0软件原则的许可下提供,这允许广泛的免费使用。
再一次问好