算力: 算力租赁价格平稳,字节Seed 首次开源代码模型 近日,字节Seed 首次开源代码模型Seed-Coder,8B 规模,超越Qwen3,拿下多个SOTA。它证明“只需极少人工参与,LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力,这可以被视为对DeepSeek-R1 模型自我生成和筛选训练数据策略的扩展。一共包含三个版本: Base 、Instruct 、Reasoning , 其中,Instruct 在编程方面表现出色,拿下两个测试基准SOTA。而推理版本在IOI 2024 上超越了QwQ-32B 和DeepSeek-R1。 Seed-Coder 的前身是doubao-coder,采用Llama 3 结构,参数量为8.2B,6 层,隐藏层大小为4096,采用分组查询注意力(GQA)机制。最关键的工作是数据的处理,Seed 团队提出了一种“模型中心”的数据处理方式,使用模型来策划数据。具体来说,模型会从GitHub 和网络档案爬取原始代码数据,经过几个处理步骤后输出最终的预训练数据。 基于基础模型,Seed 团队还开发了Seed-Coder 的两个特殊变体——指令模型(-Instruct):目的是增强模型的指令遵循能力,其训练分为监督微调(SFT)第二阶段和直接偏好优化(DPO)两个阶段;推理模型(-Reasoning):目的是提升模型在复杂编程任务中的多步推理能力,采用长链条思维(LongCoT)强化学习训练。首先使用从编程竞赛问题和高质量模型生成的解决方案进行预热训练,然后通过GRPO 框架实施强化学习训练。这两个变体的设立,进一步扩展了Seed-Coder 的实用性。 AI 应用: Gemini 平均访问量环比 +8.99%,鸿蒙电脑搭载鸿蒙 AI 5 月8 日上午,华为举行鸿蒙电脑技术与生态沟通会,会上,华为详细介绍了历时五年研发的鸿蒙电脑,并预告将于 5 月19 日召开首款鸿蒙电脑新品发布会。鸿蒙电脑从内核层实现全栈自研,在性能、安全及互联体验上实现突破,更重要的是,其为国产软件提供了全新发展空间 —— 国产软件无需被动适配,能够主动构建自身生态规则。 目前,超 150 个专属电脑生态应用加速适配,超 300 个融合 生态应用已完成适配,预计年底支持超 2000 个,覆盖办公、设计等核心场景。小红书、B 站、飞书等已适配鸿蒙电脑端,用户可享移动端内容与电脑大屏键鼠的高效操作。 “一应用,全场景”体验提升用户粘性,为开发者开辟增量市场。飞书借鸿蒙“一次开发,多端部署”特性,仅一周完成电脑端基础适配,实现移动端与电脑端功能同步,让开发者聚焦创新,降低生态构建门槛。 鸿蒙电脑的亮相,标志着国产操作系统终于迈出了从“可用”到“好用”的关键一步。它不再只是技术的堆砌,而是生态的重构。 AI 融资动向: AI 编程独角兽获9 亿美元融资,估值达90 亿5 月6 日,AI 代码编辑器初创公司Anysphere 据报道已完成9亿美元融资。此轮融资由Thrive Capital 领投,AndreessenHorowitz 和Accel 等知名机构跟投。公司估值从今年1 月的25 亿美元大幅攀升至90 亿美元。Anysphere 的年度经常性收入(ARR)已突破2 亿美元。 Anysphere 的旗舰产品Cursor 是一款创新的代码编辑器,采用分屏界面设计:一侧显示用户代码,另一侧提供AI 聊天机器人。开发者可以通过自然语言提示指导AI 进行代码修改,底层AI 能够一次生成多行代码。Cursor 具备网络搜索和项目文档查询能力,可将复杂任务分解为更小的步骤。 在技术层面,Cursor 整合了来自OpenAI、Google 等供应商的语言模型,并于去年推出了自研模型Cursor-Fast。根据公司描述,该模型的编码能力介于GPT-3.5 和GPT-4 之间。最新的招聘信息显示,Anysphere 正在寻求研发专家混合(MoE)算法,以进一步提升AI 性能。 值得注意的是,OpenAI 此前曾试图收购Anysphere 未果,今日也正式与其竞争对手Windsurf(前身为 Codeium)达成收购协议,交易金额约30 亿美元。这是 OpenAI 迄今为止规模最大的一笔收购。Windsurf 正式名称为 Exafunction Inc.,此前在由 General Catalyst 领投的融资中估值为12.5 亿美元。 此次收购将帮助 OpenAI 在 AI 辅助编程工具市场上应对日益激烈的竞争。这个快速发展的细分市场专注于基于自然语言提示来生成代码的智能系统。目前,OpenAI 的竞争对手Anthropic 和微软旗下的 Github 都提供类似的 AI 编程工具,同时包括 Anysphere 在内的新兴创业公司也获得了大量投资。OpenAI 最近刚完成由软银集团领投的400 亿美元融资,公司估值达到3000 亿美元。同时,OpenAI 在周一表示,由于面临公众压力,该公司放弃了转型为传统营利性企业的计划。 投资建议 算力方向:据中国基金报报道,英伟达或为应对出口限制将推出降级版H20,导致性价比显著下滑,关注国产替代到长线机会。 应用方向: 苹果Safari 浏览器计划引入Perplexity 、Anthropic 等AI 搜索引擎作为可选工具,重构应用生态,关注AI 应用的新机会。 中长期,建议关注临床 AI 产品成功落地验证的嘉和美康( 688246.SH ) 、以AI 为核心的龙头厂商科大讯飞( 002230.SZ ) 、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于 GB200放量的鼎通科技(688668.SH)、已与Rokid 等多家知名AI 眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。 风险提示 1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。 |