type
status
date
slug
summary
tags
category
icon
password
反刍系列,即对他人输出内容的理解
把那些匆忙剪藏的内容拿出来再嚼吧两下,或许能品尝到不同滋味
1. 背景
- iPhone要推出AI功能,但国内市场不能直接使用海外模型,因此需要和国内模型厂商达成合作
- 一开始传言是和百度合作,最后选择了和阿里合作
2. 苹果需求
- 多模态:文字,视频,图片,音频都需要接入AI
- 隐私要求高,需要云端和端侧都分别部署
3. 为什么不是deepseek
Deepseek目前能力和苹果需求不匹配
苹果需要的是一个工程专家,完全敞开为他的需求落地产品
Deepseek是一个技术专家,深入挖掘AIGC,达成AGI目标
4. 为什么是阿里
4.1. 各类模型都有
- 覆盖多模态
- 大到上百B,下到0.5B,各个尺寸都有
4.2 模型性能强
- 评分高,72B的模型超高了llama3.1 405B
- 全球技术社区中热度高,口碑好
4.3 工程化
- 一些落地配套功能做的很好,例如function cal等
- 支持多语种,跨语言翻译能力效果好
- 落地到了大规模的场景中,已经走通了路径
4.4 开放
- 完全开源,可以商用
- llama架构,与各种infra都能对接上
4.5 支持力度
- 阿里云:直接商用
- 研究团队:人力配合
5. 开源的胜利
- 开源获得了社区的认同,社区反馈开发,提升速度
- 良好的社区互动,形成强大的品牌影响力
- 开源可以反哺商业化,证明自己团队的强大,自然会有合作商来下单
- Author:培风
- URL:http://preview.tangly1024.com/article/1e5a80cd-73cf-800b-93db-c9bdaaad0b4f
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!