# AI及信息技术应用2023年11月19日简报

## 4. 深度分析正文


AI及信息技术应用2023年11月19日简报
======================


本周的AI产业周报涵盖了多个关键领域，包括重要人事变动、技术应用、产品创新、监管与合规等。OpenAI的首席执行官山姆·奥特曼离职，GPT-4 Vision在Web应用程序的多种实用场景，xAI推出的PromptIDE等。还有Spotify和Google Cloud合作，谷歌推出的新AI音乐工具，以及NVIDIA发布的新GPU等。此外，还涉及法律道德考试、AI在YouTube、Airbnb的应用，以及亚马逊的安全机器人等。最后，包括监管和合规动态，如谷歌对越南诈骗者的诉讼，OpenAI与组织合作构建数据集，以及欧洲的AI法案谈判等。这些报道显示了AI领域的快速发展和广泛应用，同时也强调了监管和道德考虑的重要性。

**1，AI产业应用**

突发！“ChatGPT 之父”奥特曼被 OpenAI 董事会罢免

\[摘要\]腾讯新闻《一线》 纪振宇 11月17日发自硅谷人工智能初创公司OpenAI美国时间11月17日突发声明，宣布公司首席执行官山姆·奥特曼将离开公司，公司现首席技术官米拉·穆拉蒂被任命为临时首席执行官。

GPT-4 Vision 在 Web 应用程序中用例

\[摘要\]本文介绍了 GPT-4 Vision 在交互式 Web 应用程序中的八种实际用例。包括使用 GPT-4 Vision 从草图和静态图像构建 Streamlit 应用程序、将屏幕截图转换为 HTML/Tailwind CSS 代码、使用 OpenAI Vision API 创建个人艺术评论家等。还探讨了使用 GPT-4 Vision 进行保险调整和自动驾驶的潜力

xAI 推出 PromptIDE：即时工程和人工智能 AI 透明度的新前沿

\[摘要\]xAI 推出了 PromptIDE，这是一个集成开发环境，旨在彻底改变即时工程和机器学习模型的可解释性，提供模型的实时探索和操作等功能参数、丰富的分析和协作共享功能。

Spotify 正在使用 Google Cloud 的人工智能来帮助改进对其播客和有声读物的定制推荐

\[摘要\]Spotify 将使用 Google Cloud 的大型语言模型来更深入地了解其“语音内容”的模式，这应该会提高其提供个性化推荐的能力。LLM将帮助 Spotify 分析其内容库中的 35 万本有声读物和 500 万个播客。据新闻稿称，此举可以帮助 Spotify 更好地了解图书馆的广度，并“增强”用于向客户展示有声读物和播客的元数据，例如标题、节目说明、主持人名称等。Spotify 自 2016 年以来一直与 Google Cloud 合作。通过扩大人工智能合作伙伴关系，Spotify 还将探索使用法学硕士来识别潜在有害内容，

谷歌正在为 YouTube 推出新的人工智能工具

\[摘要\]允许用户使用文本提示或哼唱的旋律来创建音乐曲目。其中一项实验性工具Dream Track可以生成 9 名不同艺术家风格的 30 秒音乐剪辑，其中包括 Charli XCX、Demi Lovato 和 John Legend。借助 Dream Track，用户可以输入基于文本的提示并选择一位艺术家，他们都曾与 Google 合作过该项目。然后，人工智能会以该艺术家的声音和风格自动生成原创歌曲片段。这些歌曲专门在 YouTube Shorts 上使用。

英伟达发布全新 HGX H200 计算平台，配备先进内存以处理人工智能工作负载

\[摘要\]Nvidia 宣布推出全新H200芯片，这是“世界上最强大的 GPU”，用于加速 AI 应用。Nvidia 表示，它正在与系统制造商和云服务提供商合作，从 2024 年第二季度开始提供这些芯片。

根据 LegalOn Technologies 的研究，OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 可以通过法律道德考试

\[摘要\]法律科技公司 LegalOn 测试了一些顶级生成式 AI 模型回答为法律道德考试或多州职业责任考试 (MPRE) 设计的问题的能力。LegalOn 对未受过法律道德培训的法学硕士进行了 100 场模拟考试，由南德克萨斯法学院休斯敦分校的一位教授提出问题。GPT-4 在所有测试的大型语言模型中得分最高，达到 74% 的准确率，比人类测试者的平均水平高 6%。GPT-4 和 Claude 2 的得分都高于所有州 MPRE 的估计通过门槛（范围从 56% 到 64%）。

NVIDIA全新旗舰AI芯片

\[摘要\]Nvidia宣布推出全新旗舰AI芯片H200。与前身 H100 相比，新芯片的内存容量和带宽显着增加，使其成为密集型生成 AI 工作负载的理想选择。

Airbnb收购AI初创公司，助力构建终极旅行代理

\[摘要\]Airbnb近日以约 2 亿美元的价格收购了 GamePlannerAI，这是一家极其隐秘且模棱两可的人工智能初创公司，由 Siri 联合创始人 Adam Cheyer 共同创立。以加强其在旅游领域的人工智能技术。该 startup 将帮助 Airbnb 建立一个更智能的旅行代理，从而提供更好的旅行体验。这次收购进一步展示了 Airbnb 对人工智能技术的重视，以及其不断推进旅行业务创新的意图。

亚马逊为小型企业带来安全机器人

\[摘要\]亚马逊通过推出 Astro for Business 来重新调整其家庭机器人的用途，供企业使用，Astro for Business 是该机器人的改进版本，可充当中小型企业的保安。该版本将具有增强的功能，例如多个安全监控路线以及针对特定声音（例如烟雾和一氧化碳警报或玻璃破碎）的警报，起价为 2439.99 美元。虽然价格不菲，但我想它与全职 24/7 保安相比就相形见绌了。

谷歌的天气预报项目开源

\[摘要\]谷歌开发的一种名为 GraphCast 的新型人工智能天气预报模型比传统模型（包括被视为黄金标准的欧洲模型）准确得多。大多数天气变量的准确度提高了 10-15%。

微软推出定制 AI 芯片：Azure Maia 100 和 Cobalt 100

\[摘要\]微软宣布与谷歌和 Nvidia 建立新的合作伙伴关系，以改善跨平台的数据共享和人工智能模型开发，以及微软的新硬件和软件，例如名为 Maia 和 Cobalt 的人工智能芯片，并扩展了人工智能助手 Copilot 的功能。

Microsoft Teams 正在通过 AI 驱动的功能增强用户体验，并向元宇宙迈进。

\[摘要\]Microsoft Teams 正在通过 AI 驱动的功能增强用户体验， 并向元宇宙迈进，包括 AI 语音过滤和后台优化。这些更新旨在改进平台功能、通信和定制。Teams 通话中的 AI 语音过滤功能通过隔离说话者的声音来提高音频质量。Microsoft Mesh 在 Teams 中引入了具有自定义头像和空间区域的 3D 空间。Teams Premium 将于 1 月份推出，将包含 Microsoft Mesh 功能。新的 Teams Web 体验保证了更快的性能并减少了内存使用量。更新包括新的键盘快捷键、改进的代码块和聊天转发。

微软如何减少对OpenAI的依赖

\[摘要\]微软通过推出与Copilot品牌相关的新产品和服务，以及在Azure AI Studio上支持开源模型，正在减少对OpenAI的依赖，从而在AI市场中保持关键地位。

微软推出深度伪造视频工具

\[摘要\]微软在Ignite 2023活动上发布了一个新工具，可以创建逼真的虚拟形象和个性化语音服务，但对这些功能的使用设置了明确的限制和要求。

Meta 的 AI 生成视频

\[摘要\]Meta 推出了名为 Emu Video 和 Emu Edit 的新 AI 工具，可以根据文本描述或现有图像/视频生成动画短视频剪辑。这些剪辑显示了基本的场景和动作，但仍有很大的改进空间。

Meet Jarvis 1：一种具有记忆增强的多模态语言模型的高性能开源世界多任务代理

\[摘要\]本文介绍了一种名为Jarvis 1的高性能开源世界多任务代理，该代理采用记忆增强的多模态语言模型，并基于translo窗口基于掩码点变换器框架LLAVA Plus以及许多其他研究趋势构建而成。Jarvis 1在多个领域取得了令人瞩目的成绩，它的出现为AI ML研究带来了巨大的进步。

大模型时代下的“手脑并用”：RPA +FD-LLM

\[摘要\]利用大模型的强大语言理解和生成能力，成功落地多类型机器人和7X24小时在线智能问答，减少RPA中的人工干预，满足企业数字化转型中的全自动化流程需求。金融企业对RPA的需求更趋于高效智能，可以像“人工”一样可以“手脑并用”地处理问题，比如智能问答少一些“答非所问”，产出报告不局限于一些简单格式，一起来看2个实例：以某农商行项目为例，利用RPA和提示工程技术，成功打造了远程银行智能客服，构建合规知识库，，帮助银行实现产品快速开发和精准营销。

微软发布 Personal Voice：你可以克隆自己的声音说任何语言

\[摘要\]微软新推出的Personal Voice技术可在仅需1分钟语音样本的情况下，快速克隆并生成相同AI语音。支持中文、西班牙语、德语等100种语言。该技术采用设备端机器学习保证隐私安全，与LiveSpeech集成，便于用户交流。为防止滥用，增加了水印安全措施，以识别Azure AI Speech合成的语音。将于西欧、美国东部和东南亚先行推出，并在12月1日开始公共预览。

LLaMA-Factory：羊驼工厂，简化大语言模型的微调

\[摘要\]通过提供一个易于操作的Web界面，LLaMA-Factory允许用户在浏览器中直接进行模型的训练、评估和推理，无需复杂的命令行操作, 预集成了多种流行的大型语言模型，包括LLaMA、BLOOM、Mistral、Baichuan、Qwen和ChatGLM, 它们都已经设置好了，你只需要选择一个开始使用，不需要自己从头设置。还提供了不同的训练方法，你可以根据自己的需要选择最合适的。这样就不需要自己去编写复杂的训练程序。

DeepMind 开发出 GraphCast 天气预测AI模型

\[摘要\]DeepMind开发的GraphCast是一种创新的人工智能天气预测模型，能在不到一分钟内完成长达10天的天气预测，准确率超过业界高标准的欧洲中期天气预报中心（ECMWF）的高分辨率天气模拟系统（HRES）。GraphCast通过深度学习和图神经网络（GNNs）技术，可预测极端天气事件，如飓风、洪水。其全球覆盖能力达0.25度经纬度高分辨率，覆盖超过一百万个网格点。GraphCast还支持持续学习和适应，以提高预测准确性。DeepMind已将GraphCast代码开源，便于全球科学家和预报员使用。

GPT ChatAnything：与增强角色视频聊天的新技术

\[摘要\]ChatAnything允许用户通过文本描述生成具有独特个性、外观和声音的虚拟角色，并与之进行语音或视频聊天。它基于大语言模型（LLM）来创建个性化角色，结合了文本到语音（TTS）技术和文本到图像生成技术，以及面部运动生成技术，使虚拟角色在视觉和听觉上更加真实、有表现力。其目标是让用户通过文本动画化任何人格化的事物。

亚马逊大模型Olympus曝光！2万亿参数秒杀GPT-4

\[摘要\]新芒Group 发布:， 新芒11月13日消息 11月8日，媒体报道称，亚马逊正在训练他的第二个大语言模型——内部代号为“Olympus”，很有可能在今年12月份上线。

决策增强与智能知识管理:人脑的第三个系统

\[摘要\]若引入大型语言模型基础设施作为辅助决策工具，可视为新增的一个层次，将其视为“系统三”，这一系统可以被看作是辅助决策工具，为人类决策过程提供知识支持、数据分析和逻辑推理，重重复性工作的自动化处理，以及复杂来源的数据和信息的自动化整合。

智谱 AI：追赶 OpenAI 的挑战与策略

\[摘要\]智谱 AI 训练大模型的数据主要来自公开数据、团队多年来积累的数据、交换或采购合作伙伴数据。做大模型，没有好走的路 在 2020 年之前，智谱 AI 主要从事算法研究工作，研究是团队的强项，这部分工作相对容易。但在通用大模型和行业小模型的选择上，智谱 AI 虽然有参考 OpenAI，但还是决定坚持走通用大模型这条路

2，产品创新

OpenAI每个人都能定制GPT

\[摘要\]上下文窗口提高到128k，相当于一次能输入300页的书籍更多控制：保证输出格式的JSON模式新增seed参数，实现可重复的输出未来几周内还将追加logprobs参数，查看模型最有可能的输出概率分布知识截止到2023年4月多模态视觉、DALL·E 3和语音合成API一起开放开放GPT-4微调双倍GPT-4调用速率限制当然GPT3.5 Turbo也更新到1106的新版本，在内部评估中，格式遵循任务提高了了 38%。

Rask.ai语音AI和视频编辑器

\[摘要\]Rask AI 是一款具有语音克隆功能的视频本地化工具，集语音AI和视频编辑器于一体的创新产品，可将视频翻译和配音为 130 多种语言，使得用户能够更便捷地使用语音命令进行视频编辑。此技术首次将语音识别和AI算法应用于视频编辑领域，大大提高了工作效率，为用户提供更加智能化的使用体验。

微软推出新的人工智能工具品牌copilot，增强云和客户服务

\[摘要\]微软在其 Copilot 品牌下推出了几款新的人工智能工具，例如 Copilot for Azure、Copilot for Service 和 Copilot Studio。这些工具旨在协助云管理、客户服务和创建定制人工智能解决方案，为各种业务需求提供多功能应用程序。

YouTube 测试克隆流行歌星声音的人工智能工具

\[摘要\]YouTube 正在与Google DeepMind 合作测试Dream Track 。这个人工智能工具可以让用户通过模仿 Demi Lovato、Sia、John Legend 等著名歌手的声音来创作歌曲。目前，该功能仅可供美国约 100 名创作者在 YouTube Shorts 中使用。

Notion 利用 AI 来查找您的笔记

\[摘要\]Notion 刚刚发布了新的AI助手Q&A，旨在帮助用户更好地组织他们的数字生活。问答回答查询并引用来源，旨在成为文档中的巨型大脑。所有 Notion 用户均可以每月 8 美元的付费附加功能使用这项新功能。

OpenAIdevday 后注册激增，暂停高级注册

\[摘要\]OpenAI 刚刚停止了新的 ChatGPT Plus 注册，首席执行官 Sam Altman 表示开发日后需求巨大。由于在激增期间受到中断和攻击的困扰，OpenAI 目前正在关闭商店，重新专注于稳定平台。

Ozone：AI 剪辑工具

\[摘要\]Ozone,一个可以使用AI技术快速制作视频的平台。可以帮助用户通过AI自动完成许多编辑任务,如颜色校正、静音处理、B轴视频插入、过渡效果、字幕等,从而大大节省时间。它支持4K及更高分辦视频编辑和播放，提供实时多人协作功能,可以共同编辑视频、添加评论。它还可以自动识别视频画面内容,更快找到需要的片段。此外,Ozone还支持不同平台自动调整视频尺寸,并提供工作区、团队及资源管理功能,方便多人协作开发内容。

WhatsApp 为大型团体推出类似 Discord 的新语音聊天功能

\[摘要\]知名即时通讯应用 WhatsApp 宣布为大型团体推出一款全新的语音聊天功能，旨在与热门游戏引擎 Discord 竞争。该功能将为用户提供更丰富的沟通方式，让团队内部及之间的联系更加便捷，WhatsApp 为大型群组推出了类似于 Discord 的语音聊天功能，该功能的设计比群组通话的干扰更小，群组通话会响铃每个群组成员

POPAI：办公效率工具

\[摘要\]PopAi是一个类似 ChatGPT 的聊天产品，但是集成了很多工作时可以用到的效率工具，比如 PPT 和流程图生成，提示生成等。率先集成了 GPT-4V 的图像 API，而且调教的比较好，我用一个图像相关论文的图片试了一下，解释的很清楚。同时他有个比较创新的交互是在回答内容之后你可以选择一些后续的叫Enrich的操作。比如将输出内容翻译为中文或者将输出内容经过扩写重新排版和添加内容后变为一篇文章

Fabric 引入了人工智能驱动的工作区和所有信息

\[摘要\]Fabric 是一项新的人工智能驱动的服务，旨在通过帮助用户组织他们的文档和文件并提供用于查询和查询的人工智能助手，为个人生产力提供更好的文件系统和工作区。搜索信息。

Google 搜索将让您离开并阅读网页上的“注释”

\[摘要\]谷歌搜索实验室近日发布了一份报告，其中包含对未来的搜索趋势的深入探讨。报告中指出，语音搜索将成为未来搜索的主要方式，同时图像搜索和视频搜索也将得到进一步发展。此外，个性化搜索和本地搜索也是未来搜索的重要方向。谷歌首次推出 Notes，这是一项搜索实验室实验，可让用户对搜索结果进行注释，包括使用图像和彩色字体；笔记“几分钟内”就会出现。

3，监管与合规

谷歌起诉越南诈骗者利用虚假广告散布恶意软件

\[摘要\]谷歌在加州提起诉讼，指控越南诈骗者利用社交媒体广告推广假冒的Bard下载链接，其中包含恶意软件。诉状称这些诈骗者使用“Google AI”和“AIGoogleBard”等商标，窃取用户社交媒体登录信息。谷歌法律顾问普拉多表示，该诉讼旨在建立法律先例，保护创新领域不受诈骗。自4月以来，谷歌已发出300多项删除请求。

OpenAI 希望与组织合作构建新的 AI 训练数据集

\[摘要\]OpenAI 正在启动 Data Partnerships，该计划旨在与第三方组织合作，为 AI 模型训练创建新的数据集，以解决人工智能模型训练中存在的缺陷和偏见。当前数据集。

NVIDIA预测生成AI将比互联网市场容量更大

\[摘要\]在微软会议期间，Nvidia 首席执行官黄仁勋 (Jensen Huang) 称 GenAI 是“计算史上最重要的平台转型”，并表示它将比个人电脑、移动设备和互联网规模更大。

英国将在“短期内”避免监管人工智能

\[摘要\]英国首席人工智能和知识产权大臣乔纳森·卡姆罗斯子爵周四在《金融时报》会议上表示，“短期内”英国不会制定人工智能法律，因为政府担心严厉的监管可能会抑制行业发展生长。这一消息发布之际，世界各地的高管和政策制定者正在争论如何监管这一新兴技术，该技术有望改变许多行业，并在过去一年推动大型科技公司估值的上升。欧盟在这一领域处于领先地位，其人工智能监管立法预计将在今年年底前生效。

欧洲人工智能法案谈判正处于关键时刻

\[摘要\]欧盟立法者正在就《人工智能法案》进行紧张谈判，该法案是监管人工智能应用的框架。造成分歧的关键问题包括禁止人工智能实践和基本权利影响评估，主要关注国家安全豁免和行业游说的影响。

Giskard 开源框架：AI 模型评估综合指南

\[摘要\]Giskard 来自法国，是一家创新型初创公司，致力于通过其开源测试框架彻底改变人工智能行业。该框架专为大型语言模型量身定制，为开发人员提供有关潜在偏见、安全漏洞以及模型生成有害或有毒内容的倾向的重要警报。Giskard 符合这些监管框架，是提供致力于提高测试效率的开发人员工具的先驱，从而帮助公司通过确保遵守必要的标准来避免严厉的处罚。

YouTube 严厉打击人工智能内容

\[摘要\]YouTube宣布了新规则，要求创作者披露其内容是否由人工智能生成，或以任何方式融入人工智能元素。该平台由谷歌拥有，表示新条款将在未来几个月内推出，并指出不遵守的创作者可能会发现自己被取消货币化，甚至帐户被暂停。此外，如果观看者认为人工智能被用来模仿某人，YouTube 很快将允许观看者标记可能被删除的视频。

北京再放政策大招！为AI大模型提供公共算力平台，培育10家独角兽

\[摘要\]海淀区委副书记、区长李俊杰发布了《中关村科学城通用人工智能创新引领发展实施方案》，该方案提出要打造2300亿元核心产业规模，集聚100家大模型企业机构，以及60家国家级专精特新小巨人企业，以及新培育5-10家独角兽企业。

---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20231119-ai20231119](https://www.haxitag.com/briefs/ai-brief-20231119-ai20231119)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。