首页> 软件教程> 字节跳动BitsAI-CR：基于LLM的代码审查系统技术揭秘

字节跳动BitsAI-CR：基于LLM的代码审查系统技术揭秘

来源：网络时间：2025-05-19 15:03:26

在字节跳动的数字迷宫中，隐藏着一扇通往未来编程世界的神秘之门——BitsAI-CR，一个由智慧与创新锻造的代码审查系统。在这人工智能的新纪元，大语言模型不再仅仅是文字的游戏，而是化身为软件质量的守护者，挑战着传统代码审查的极限。

故事发生在一个由算法编织的梦想工厂，工程师们日夜穿梭在行行代码间，他们的渴望如同星辰，照亮了研发效率的未知道路。面对代码审查的重重迷雾，BitsAI-CR如破晓的曙光，以其独创的“识别+验证”双剑合璧架构，革新了行业标准。

主角是一位名叫艾薇的年轻程序员，她与她的虚拟伙伴——智能审查员“慧眼”，在代码的海洋中展开了一场前所未有的冒险。慧眼，凭借字节跳动的219条黄金规则，不仅精准捕获代码中的瑕疵，还能避开“幻觉”的陷阱，它的存在让每一次审查都成为一场智慧的较量。

艾薇与慧眼的组合，就像现代科技与未来梦想的碰撞，他们在挑战中成长，将效率的火花撒向整个开发团队。在这个故事里，我们见证了技术如何跨越障碍，将不可能变为现实，让代码世界变得更加清澈高效。在BitsAI-CR的引领下，字节跳动的开发者们共同编织了一个关于创新、效率与梦想的传奇。

字节跳动ai代码审查系统bitsai-cr：提升研发效率的实践探索

在人工智能浪潮下，大语言模型(LLM)正深刻改变软件开发模式。字节跳动近日公开其内部广泛使用的代码审查系统BitsAI-CR的技术细节，展现了AI在提升企业研发效率方面的显著进展。

论文地址：

代码审查是保障软件质量的关键，但在大型企业中却面临诸多挑战。字节跳动内部数据显示，超过六成工程师渴望更高效的代码审查工具。虽然LLM在代码理解方面潜力巨大，但工业级应用仍面临三大难题：审查准确率低、低价值评论过多以及缺乏系统性改进机制。针对这些挑战，BitsAI-CR应运而生，并在服务超过1.2万周活跃开发者的实际应用中，实现了75%的审查准确率和26.7%的评论过时率。

两阶段评论生成架构：确保高质量审查

传统LLM代码审查方案常受困于低准确率和幻觉问题。字节跳动研究团队通过实验发现，单纯依靠模型微调效果有限。因此，他们创新性地采用了“识别+验证”的两阶段生成架构：

　　　　RuleChecker:利用Tree-sitter技术精确识别代码块和函数边界，构建上下文，并基于字节内部219条多维度审查规则，使用LoRA微调的Doubao-Pro-32K-0828模型生成审查评论。这些规则涵盖代码缺陷、安全漏洞、可维护性和性能等四个方面，并集成动态规则黑名单，确保审查标准与企业实践动态一致。　　　　

　　　　ReviewFilter:为了过滤模型幻觉和低价值评论，另一个微调的Doubao-Pro-32K-0828模型对RuleChecker的输出进行二次验证，对每条评论进行“是/否”判断并给出理由。实验表明，“结论在前”的推理模式性能最佳，准确率达77.09%，且推理时间较短。　　　　

最终的审查结果通过评论聚合机制处理，利用基于Doubao-embedding-large的向量化方法计算评论相似度，避免重复信息干扰开发者。实验显示，该架构在Go语言离线评测集上实现了65.59%的评论准确率。

评论过时率(OutdatedRate)：更全面的评价指标

研究团队引入“评论过时率”指标，通过追踪被标记代码行在后续提交中的修改比例，更客观地衡量审查建议的实际价值。

数据飞轮：持续优化系统

BitsAI-CR采用数据飞轮机制持续优化审查规则。通过用户反馈、人工标注和每周的OutdatedRate监控，系统能够识别并改进高准确率但低实用性的规则，确保系统持续保持高实用性。在18周的部署中，评论准确率从25%提升至75%，Go语言场景下的OutdatedRate达到26.7%，接近人工审查水平。目前，系统已服务超过1.2万名周活跃开发者，用户满意度达74.5%。