查看原文
其他

MotokoPilot:利用人工智能增强 Motoko 开发社区的能力

Dfifans Internet Computer 2023-10-20


在人工智能在各个领域取得长足进步的时代,软件开发也不例外,事实证明,人工智能工具的出现可以显著提高开发人员的工作效率,简化新语言和框架的学习过程,并增强整体开发工作流程。
尽管取得了这些进步,但大多数大型语言模型(LLM)在涉及不太知名的语言(例如 Motoko)时的适用性受到一定限制。
这主要是由于用于训练这些模型的数据集中缺乏 Motoko 的示例,为了应对这一限制,ICPCS 团队采取了一项举措:开发 MotokoPilot。
为了弥补现有 LLM 留下的差距,MotokoPilot 项目涉及使用源自各种开源 Motoko 代码存储库的综合数据集来训练最先进的人工智能模型,通过微调这些基本模型以专门满足 Motoko 的需求,我们正在尝试提供专为互联网计算机开发量身定制的强大且智能的开发解决方案。
为了实现这一目标,我们还开发了一个 VS Code 扩展,可以无缝集成我们经过训练的模型,这种集成旨在解决开发过程的各个方面,包括代码生成、文档生成以及调试或重构代码。


数据集创建和模型训练
我们数据集的创建涉及从开源存储库、Dfinity 开发者论坛以及其他公开资源中抓取 Motoko 代码文件的半自动化过程,我们使用定制工具将这些文件解析为更小的代码片段,然后,在研究人员的监督下,使用 GPT-3.5 API 将这些片段用作生成自然语言描述的提示。
结果?全面且高度详细的提示完成对数据集,构成了我们使用 OpenAI 库创建的微调 Motoko 模型的基石。
VS Code 扩展开发
我们的 VS Code 扩展旨在为使用 Motoko 语言的开发人员提供全面的解决方案,我们还非常注意确保扩展与其他流行工具(例如 GitHub Copilot)的兼容性,借助简单但有效的用户界面,用户可以通过可自定义的热键或右键单击上下文菜单访问人工智能支持的功能。


数据集增强
该策略的一个关键部分是对我们的原始数据集进行彻底的审查和清理,我们计划消除任何不相关或低质量的代码示例,并确保数据集代表高质量的 Motoko 代码。
这种精心策划将使我们的人工智能模型能够生成更准确、更符合开发人员需求的代码建议,在我们建立了坚实的基础并测试了我们的提示完成对生成方法后,数据集将使用更多的源和存储库进行增量更新,从而进一步增强最终产品。
利用先进的基础模型
为了访问 GPT-4 API,我们的目标是利用其高级功能来创建提示完成对的增强数据集,GPT-4 API 在代码和自然语言理解和生成能力方面显示出显著改进,并将其集成到我们的方法中预计将大大提高人工智能生成的代码和文档的质量。


利用人类反馈
为了微调模型,我们打算实施改进的人类反馈强化学习(RLHF)方法,这涉及让社区志愿者参与评估人工智能生成的输出的质量和正确性并提供反馈,这种迭代细化过程将使人工智能生成的输出与开发人员的期望保持一致。
一旦这些改进到位,我们计划与广泛的开发人员进行全面的用户研究,该研究旨在评估 MotokoPilot 扩展的有效性,重点关注性能、完成时间和整体用户体验。
从这项研究中获得的宝贵反馈将推动我们的扩展的进一步增强,我们欢迎所有开发者,无论经验如何,参与本次 Beta 测试,提交内容已在我们的网站上开放:
  • ai.icpcs.io

在 ICPCS,我们坚定地致力于确保 MotokoPilot 不仅仅是一个工具,而且是 Motoko 开发社区的宝贵伴侣,通过提高开发人员的生产力和加速学习过程,我们渴望为 Motoko 和整个互联网计算机生态系统的成功做出重大贡献。
在我们踏上这一激动人心的旅程时,我们对 MotokoPilot 对 IC 开发人员以及整个 ICPCS 社区所具有的变革潜力感到乐观,随着我们在使命中不断前进,请继续关注更多更新!


来源:ICPCS翻译:Catherine

-              -


由 Encode 提供支持的互联网计算机 BUIDL 比特币黑客马拉松:总结和获奖者

宣布 Motoko 开发服务器:Web3 dapp 的实时重新加载

Motoko 和 AgorApp 嵌入式 IDE 一览





你关心的 IC 内容
技术进展 | 项目信息 | 全球活动


长按关注 IC 微信公众号

掌握最新资讯


*添加小助手微信 comiocn 进交流社群


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存