# AI及信息技术应用2024年3月17日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，通过机器学习和算法实现智能决策、问题解决和信息处理。

## 2. 核心洞察 (TL;DR)
- Cohere Command-R企业级语言模型展示自动化和智能化潜力
- OpenAI的Sora视频生成工具预示影视行业变革
- Cognition的Devin成为首个自主AI软件工程师

## 3. 关键事实与数据
- 关键事实1: Cohere Command-R拥有350亿参数，支持10种主要商业语言，包括中文
- 关键事实2: Sora视频生成工具可在几分钟内生成720p分辨率视频
- 关键事实3: Devin在SWE-bench编码基准测试中表现出色，超过之前最高水平

## 4. 深度分析正文


AI及信息技术应用2024年3月17日简报
=====================


上周，人工智能领域迎来了多项突破性进展。Cohere Command-R作为一款企业级语言模型，展现了在自动化和智能化业务系统中的潜力。OpenAI的Sora视频生成工具预示着影视行业的重大变革。Cognition的Devin成为首个自主AI软件工程师，而DeepMind的SIMA AI代理在游戏体验中实现了自然语言互动的飞跃。苹果公司通过发布MM1大型语言模型和收购DarwinAI，加强了在AI领域的布局。此外，欧盟的全面AI法规和谷歌对选举信息的AI限制，突显了对AI技术监管的重视。同时，ChatGPT的高能耗问题引发了对AI环境影响的关注

> **1，AI产业及应用研究**
> ---------------

Command-R：引领企业级语言模型新范式，引导你的业务系统走向自动化与智能化

**摘要：** cohere Command-R是一款具有350亿参数、支持128K上下文的高性能企业级语言模型，支持10种全球主要商业语言，包括中文。该模型重点在于检索增强生成（RAG）和工具使用，以实现自动化并在大规模的信息库中寻找相关信息。Command-R可直接与已有业务系统整合，从概念验证到生产的各种用例都可以支持，使得企业无需太大改变就可迈向AI时代。尽管对部分语言如中文的处理效果有待优化，但Command-R已在多个应用场景展示了其强大实力，例如快速检索信息，驱动智能对话系统，以及通过集成API和工具自动化任务。Command-R的出现无疑为企业带来了一种强大且可扩展的解决方案，实现了业务流程的优化与高效化

OpenAI首席技术官Mira Murati在华尔街日报访谈中揭秘Sora：创新颠覆影视行业

**摘要：**OpenAI首席技术官Mira Murati在一场专访中分享了其全新的、即将发布的视频生成工具Sora的全面细节。Sora主要面向电影行业的创作人员，可以在仅需几分钟的时间内生成一段20秒长、720p分辨率的视频。首席技术官还介绍，Sora在发布版本中会和Pika一样，支持视频声效的配备。尽管Sora目前在画面连续性和抽卡结果预测性方面还有提升空间，但Mira表示，Sora在这些方面的表现已经优于其他同一领域的产品。另外，Sora还将强制添加元水印以实现真假验证，并将执行严格的提示词政策，包括不能生成公众人物形象等。在艺术和色情分界线的问题上，OpenAI也正在与艺术家合作制定合理的限制。最后，Mira透露，Sora的使用已经导致一些好莱坞动画工作室暂停了扩建计划，因为他们认为这项技术可以大大节省制作成本。

Cognition 发布世界首个自主 AI 软件工程师 Devin

**摘要：**Cognition 发布了世界首个自主 AI 软件工程师 Devin，它能够执行复杂的工程任务，包括修复代码、构建和部署应用程序等。Devin 在 SWE-bench 编码基准测试中表现出色，超过了之前的最高水平。

Devin：引领人工智能驱动软件开发的革新力量

**摘要：**Cognition AI 带来了Devin，一款开创性的人工智能助手，能够以最少的输入设计和推进全面的软件工程项目。Devin能够在一个沙盒环境中运行，利用代码编辑器和网络浏览器自主处理任务，从经验中学习，甚至可以纠正错误。这种创新引起了人工智能领域知名人士的关注，包括前特斯拉人工智能总监Andrej Karpathy，同时也获得了Peter Thiel等投资者的坚实支持。

谷歌推出 VLOGGER：用于具体化身合成的多模态扩散

**摘要：**VLOGGER 是一种基于多模态扩散的化身合成方法，它可以从人的单个输入图像生成音频驱动的人类视频。该方法建立在最近生成扩散模型的成功基础上，包括随机的人到 3D 运动扩散模型和增强文本到图像模型的空间和时间控制的新颖扩散架构。与之前的工作相比，VLOGGER 不需要为每个人进行trainning，也不依赖于人脸检测和裁剪，生成完整的图像，而不仅仅是人脸或嘴唇，并考虑了广泛的场景，例如可见的躯干或不同的主体身份，这对于正确合成会交流的人类至关重要。此外，谷歌还策划了 MENTOR，这是一个具有 3D 姿势和表情注释的新的多样化数据集，比以前的大一个数量级，带有动态手势，并在其上训练和消融了主要的技术贡献。VLOGGER 在三个公共基准测试中超越了最先进的方法，考虑了图像质量、身份保留和时间一致性，同时也生成了上身手势。

DeepMind引领潮流，SIMA人工智能代理助力沉浸式视频游戏体验

**摘要：**谷歌DeepMind最近推出了SIMA，一款先进的AI代理，能够理解并执行视频游戏中的自然语言指令。这标志着人工智能在游戏互动中的一个重大突破，将AI从单纯的对手转变为更智能、动态的伙伴，预示着未来游戏体验的全新可能。同时，这一发展也与OpenAI的Sora、Figure、Anthropic、Devin、甲骨文以及特斯拉创始人埃隆·马斯克的最新技术进展相呼应，展示了AI在娱乐和互动领域的快速发展。

苹果发布多模态大型语言模型研究成果 MM1，或成文生图产品基石

**摘要：** 苹果公司近日在一篇多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中正式公布了自家的多模态大型语言模型研究成果。该模型系列拥有高达 30B 参数，并在预训练指标和多项基准测试中展现出强大性能，表明苹果加注生成式人工智能领域的决心。此举引发了外界猜测，苹果或将基于该模型推出文生图产品。

**苹果收购 DarwinAI 以开发基于视觉的技术**

**摘要：**苹果悄悄收购了 加拿大公司DarwinAI，这是一家初创公司，以其旨在提高制造效率的视觉技术而闻名。最近的 LinkedIn 个人资料更新显示，主要团队成员已加入苹果机器学习部门， **暗示了此次收购。**

Figure 与 OpenAI 合作实现人形机器人语音功能的重大突破

**摘要：** 创新型人工智能机器人公司 Figure 宣布通过与 OpenAI 的合作，为其人形机器人 Figure 01 添加了由 ChatGPT 提供支持的自然语音功能，标志着人形机器人技术迈出了重要一步。这一突破性进展不仅使机器人能够进行自然对话和执行任务，还为通用人工智能的实现铺平了道路。该合作备受关注，得到了著名科技巨头的巨额投资，预示着自主人形机器人领域的巨大潜力和兴趣。

人工智能机器人公司Figure展示了机器人的关键技术进步

摘要：得益于OpenAI和Microsoft的支持，Figure成功在人工智能机器人的感知、决策和动作执行领域取得了重大突破。机器人拥有出色的视觉功能，能准确识别并与环境中的物体进行交互。其还具备复杂的推理能力，能根据上下文判断并证明其行动的合理性。同时，机器人在执行任务和操作环境方面展现了高度自主性。这些进步为机器人在家庭环境中发挥更全面且自主的作用，以及作为家庭助手提升人类生活质量铺平了道路。

Pieces：个性化AI助手，优化开发工具链

**摘要：** 在Pieces领域，开发者可以通过下载免费软件即时提高工作效率。该AI助手能够与IDE、浏览器和其他开发工具连接，实现工作流程的集成，并减少上下文切换。它能够生成定制代码、解答存储库问题、进行代码调试和审查，还能总结工作内容。此外，Pieces还能够轻松地将代码片段和其他工作流程材料保存到集中式存储代理中，并通过AI自动丰富它们的上下文。Pieces作为一个设备上的副驾驶，具有本地和云LLM选项，能够离线工作并随着时间的推移学习，为开发者提供更多帮助。  

Zscaler收购以色列AI数据安全初创公司Avalor，交易价值约3.1亿美元

**摘要：** Zscaler Inc.宣布收购以色列人工智能增强数据安全初创公司Avalor，交易金额约为3.1亿美元。此举旨在强化Zscaler的数据分析能力，进一步提升其为企业客户提供的服务水平，加强网络安全保障。

谷歌DeepMind的SIMA AI：合作游戏伴侣体验的一个大跃进

**摘要：**谷歌DeepMind开发的SIMA AI是一个突破性的人工智能模型，专门为玩3D视频游戏并响应人类口头指令而设计。SIMA依靠学习人类游戏画面和评注，而非直接访问游戏代码，从而实现了识别和执行各种游戏动作的能力。这表示了在创建能够泛化不同游戏技能的AI伙伴方面的一大飞跃。通过与游戏开发商合作，如《Valheim》和《模拟山羊 3》等，SIMA AI旨在提供增强的游戏体验﹑执行广泛的任务并适应新环境，超越了传统预编程行为的限制。这种创新代表了游戏世界向更动态和合作的人工智能代理的转变，揭示了虚拟世界中人工智能交互的未来可能性。

微软首次推出用于网络安全的 AI Copilot，定价灵活

**摘要：**微软将推出Copilot for Security ，这是一款专为网络安全专业人士量身定制的人工智能聊天机器人，从 4 月 1 日开始提供按使用量付费的定价模式，每小时使用 4 美元。该聊天机器人利用 OpenAI 的 GPT-4 和 Microsoft 特定的安全模型，旨在帮助识别和防范网络安全威胁。它提供安全事件的实时更新、总结威胁，并通过看板功能促进网络安全团队之间的协作。Copilot for Security 还支持自然语言查询、文件分析和代码检查，并记录所有交互以用于审计目的。

Meta推出新的AI驱动的广告工具

**摘要：**Meta发布了一款新的人工智能驱动的工具，该工具包含在Meta的Advantage+套件中，主要用途是帮助品牌改进广告和视频购物体验。该工具的功能包括让品牌自动提供产品推荐、优化各种平台上的视频以及创建多种广告变体。同时，Meta还会为品牌提供效果分析服务，并正在测试一项允许广告商将合作广告与Advantage+购物活动结合使用的新功能。

在人工智能日益受到关注的情况下，Nijta 为语音隐私技术筹集了 200 万欧元

**摘要：**法国初创公司Nijta专注于人工智能驱动的语音匿名技术，旨在解决语音隐私问题，特别是在欧洲严格的 GDPR 法规下。Nijta 由 Brij Srivastava 在法国里尔创立，已获得200 万欧元资金，为需要对语音数据进行匿名化以确保合规性和隐私的企业提供解决方案。该技术在各个领域都有应用，包括处理健康数据的呼叫中心和涉及儿童声音的教育技术。Nijta 的产品可确保不可逆转的语音保护，标志着在保护人工智能用例中的个人信息方面迈出了重要一步。Nijta 拥有七人团队并计划扩展，正在探索更广泛的应用，包括用于安全通信的实时匿名化，并旨在应对多语言服务全球市场的挑战。

韩国初创公司Hydrol AI推出人工智能伴侣娃娃以缓解老年孤独感

**摘要：**韩国初创公司Hydrol AI推出了一款售价为$1800的人工智能伴侣娃娃，目标是缓解国内老龄化人口的孤独感。据悉，Hydrol的AI娃娃利用法学硕士进行深入的对话，为独居老人提供情感支持。其功能范围包括提供用药提醒、健康指导、音乐以及向护理人员发出警告的内置传感器。公司表示，韩国地方政府已经采用了这些娃娃，迄今约部署了7000个。在超过9000名用户的试验中，该公司声称其产品已成功降低了抑郁程度，同时提高了用药依从性。

> **2，产品创新**
> ----------

AI在Google Workspace 2024年3月更新的应用

**摘要：**Google Workspace在2024年3月8日的更新中，充分利用了AI技术。通过Hovercards在Google Chat中显示特定群组消息和空间信息，利用AI预测并在iOS设备上的Google Calendar锁屏小工具中显示即将进行的活动，利用AI在Google Slides中移除图片背景。这些新增功能使Google Workspace的用户体验更加便捷和个性化。

亚马逊推出新AI工具以提升卖家体验

**摘要：**亚马逊正在发布一项新的人工智能功能，旨在帮助卖家更有效率地创建产品页面。该功能能从卖家的网站URL获取信息，然后生成包含描述和图片的亚马逊产品页面。这种新的AI工具可减少卖家把产品上架到亚马逊的时间，并强化了亚马逊的AI工具集，该工具集已能生成图片和创建产品文本。然而，亚马逊也提醒卖家，在使用此功能时，他们必须拥有任何URL链接内容的合法权利，否则可能会面临法律行动。

DoorDash推出AI工具SafeChat+以打击言语滥用

**摘要：**DoorDash推介了新的人工智能工具SafeChat+，旨在遏制其应用程序中发生的语言滥用现象。此工具可以自动识别攻击性的语言，为用户提供举报选项，并根据情况自动联系客服或取消订单，而并不影响配送评级。SafeChat+可以每分钟分析多种语言，包括英语、法语和普通话的1400多条消息。此工具运用了先进的技术来识别微妙的文本差异，比其前身SafeChat在功能上有显著的增强。这是DoorDash对于创建更安全平台承诺的一部分，其还包括应对紧急情况的SafeDash工具包，以期降低语言虐待的发生并确保所有用户的安全。

Perplexity将Yelp数据整合进其聊天机器人系统

**摘要：**Perplexity最近将Yelp的大量数据整合进了其聊天机器人系统，这一举动有望使该聊天机器人能提供更为个性化和实用的服务。Yelp的数据包含了大量的餐厅、商店和服务的用户评价和详细信息，通过引入这些数据，Perplexity的聊天机器人可以更准确地推荐相关服务和提供用户所需的信息。该公司期待这一移动能增强其聊天机器人的用户体验，并扩展其在在线服务推荐领域的能力。

Simply News：借助AI技术自动生成不同领域的播客

**摘要：**Simply News是一个创新的应用，利用AI技术，通过所谓的“Agents”搜索特定领域的新闻内容并自动生成播客。它由四个主要部分组成：The Sorter、The Pitcher、The Judge和The Scripter。The Sorter负责扫描大量新闻源，根据文章的相关性和重要性筛选适合的新闻。The Pitcher则为筛选出的每篇文章制作引人入胜的提案，以吸引更多的听众。The Judge 负责评估提案，选择哪些文章应该被报道。最后，The Scripter负责为Judge选中的文章草拟有吸引力的脚本，确保听众能清晰、准确地理解新闻内容。相对于AI生成视频，自动生成播客的技术似乎更为成熟，并正日益受到关注。其他公司，比如Perplexity也正在探索类似的技术。

> **3，监管合规**
> ----------

**微软与谷歌在欧盟的人工智能大战**

**摘要：**在向欧盟提交的一份激烈报告中，微软指责谷歌在人工智能领域占据主导地位，称谷歌自供人工智能半导体和来自 YouTube 的大量专有数据是不公平的优势。随着微软的 OpenAI 和谷歌的 Gemini 在**生成人工智能领域**占据中心舞台，冲突愈演愈烈。

OpenAI与新闻出版商达成协议：法语和西班牙语新闻内容将加入ChatGPT

**摘要：**OpenAI近日成功与主要新闻出版商Le Monde和Prisa Media达成许可协议，标记着将法语和西班牙语新闻内容合并进ChatGPT的模式转变。这些伙伴关系将为ChatGPT的回应提供时事新闻内容，同时拓宽了OpenAI的训练数据的范畴。尽管具体的财务安排尚未公布，但预估OpenAI每年可能会在新闻内容许可上花费四百万到二千万美元。

欧盟通过全球首个全面的人工智能法规

**摘要：**欧盟已经通过了世界上第一个主要的人工智能立法，该立法规定了27个成员国如何推出新的人工智能产品并为其他政府实施类似规则提供了参考。立法以大比数获得通过，预计将在今年的五月份由欧洲理事会签署，最初的规定有望在今年底生效。立法将人工智能进行风险等级评定，并对具有较大威胁的平台要求获取市场入场批准。同时，一些被认为过于危险的技术（如面部扫描和情绪识别系统）将被全面禁止。此外，生成模型开发者（比如OpenAI和Google）需要公开其模型的工作文档和数据。然而，对该立法的看法存在分歧，一部分人担心它可能会阻碍进步，而另一部分人则认为它在保护公众免受错误信息和其他威胁方面的措施还不够严格。

谷歌对Gemini AI在选举问题上施加限制

**摘要：**谷歌对其人工智能Gemini在处理选举信息方面设置了新的限制。在正在进行选举的国家，用户无法向Gemini询问有关选举的信息。这些限制正在全球范围内实施，以防止Gemini提供任何可能不准确或误导的选举相关答复。当Gemini被问及关于政党或候选人的问题时，将会显示一条消息，引导用户转向Google搜索。然而，这些限制似乎可以通过在查询中故意拼写错误的单词来绕过。谷歌表示，他们正在努力改进这些防护措施。

Midjourney禁止Stability AI工作人员使用其服务，因数据抓取导致中断

**摘要：**Midjourney近日禁止了所有Stability AI的员工使用其服务，将此举归因于由Stability AI的相关个人进行的数据抓取导致的服务中断。Midjourney称，来自Stability AI数据团队相关的两个付费账户的“僵尸网络状活动”导致了近24小时的服务中断。作为回应，Midjourney宣布了一项无限期禁止任何公司的员工参与导致中断的这种激进的自动化实践的政策。

ChatGPT的高能耗：日常用电量相当于170,000个美国家庭

**摘要：**OpenAI的ChatGPT以其巨大的能耗备受关注。据报告，ChatGPT每天约消耗超过50万千瓦时的电力，足以满足约2亿个请求。这一用电量几乎相当于170,000个美国家庭的日常用电，每户平均用电约为29kWh。OpenAI首席执行官Sam Altman也对人工智能的大量能源需求表达了担忧。此外，据称每次ChatGPT对话还需要消耗约50cl的水。这些数据再次引起了关于技术对能源和环境影响的讨论。


---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20240317-ai2024317](https://www.haxitag.com/briefs/ai-brief-20240317-ai2024317)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。