# AI及信息技术应用2023年3月22日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，通过机器学习和算法实现，使计算机能够执行通常需要人类智能的任务。

## 2. 核心洞察 (TL;DR)
- ChatGPT大幅降低了AI使用准入门槛，促进了AI能力的快速迭代和升级。
- 多家公司发布多款AI产品，包括百度文心一言、Google Bard、Adobe AI辅助生成图片等。
- AI在版权和创作者权利方面引发新挑战，如AI生成内容的版权归属问题。

## 3. 关键事实与数据
- ChatGPT发布后，AI应用爆发，降低了使用门槛，使得更广泛的用户能够反馈和体验AI。（来源：AI及信息技术应用2023年3月22日简报）
- 百度文心一言发布，具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等五大能力。（来源：AI及信息技术应用2023年3月22日简报）
- 美国版权局警告，仅根据文本提示生成的图像不符合人工创作的条件，引发AI生成内容的版权归属问题。（来源：AI及信息技术应用2023年3月22日简报）

## 4. 深度分析正文


AI及信息技术应用2023年3月22日简报
=====================

本周AI产业词频最高的是“发布”，各种升级的发布、各种算法 应用场景的产品体验的发布，出现的应用大部分都是c端体验，有人对这次AI应用爆发的总结，用的词汇叫ChatGPT大幅降低了AI使用准入门槛，这种门槛的降低使得使用者的更广泛地反馈、体验，也进一步促使AI能力更快的迭代和升级。

百度文心一言、文心一阁相继对外发布，Google bard、bing chat多模态生成图片，Adode AI辅助生成图片，算法在图片场景的应用和反馈感受更容易让人参与，也更容易理解，而问答，由于prompt的门槛所限，反倒AI编程人，让人和算法的互相调教。

另外，base在阅粒系统基础上的自动化prompt GPT3.5、GPT4、stable diffusion、Midjourney可以为你提供生产应用的便利，有需要的老铁可以联系。  

**01＃AI应用**

GPT-4震撼发布：多模态大模型

********\[摘要\]********GPT-4 实现了以下几个方面的飞跃式提升：强大的识图能力；文字输入限制提升至 2.5 万字；回答准确性显著提高；能够生成歌词、创意文本，实现风格变化。「GPT-4 是世界第一款高体验，强能力的先进AI系统，我们希望很快把它推向所有人，」OpenAI 工程师在介绍视频里说道。似乎是想一口气终结这场游戏，OpenAI 既发布了论文（更像是技术报告）、 System Card，把 ChatGPT 直接升级成了 GPT-4 版的，也开放了 GPT-4 的 API。另外，微软营销主管在 GPT-4 发布后第一时间表示：「如果你在过去六周内的任何时候使用过新的 Bing 预览版，你就已经提前了解了 OpenAI 最新模型的强大功能。」是的，微软的新必应早就已经用上了GPT-4。

百度：文心一言发布，智能云服务即将上线

******\[摘要\]******百度16日发布了中国版ChatGPT“文心一言（Ernie Bot）”，发布会上，李彦宏展示了“文心一言”五大能力，分别是“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。百度智能云将在3月27日举行新品发布会，发布系列文心一言云服务和应用产品。不同类型的企业可以依据自己需求，选取相应的云服务和产品，方便、快捷、低成本地构建自己的模型和应用。

Anthropic 正在通过聊天界面和 API 打开 Claude

********\[摘要\]********Claude基于拟人化的研究，以培训有用，诚实和无害的AI系统，可以通过聊天和API访问，能够执行各种各样的对话和文本处理任务，同时保持高度的可靠性和可预测性。“拟人化和概念有一个共同的目标，即帮助个人和企业利用AI提高生产力。Claude独特的创造性写作和摘要能力有助于我们的AI助手Intion AI的发展。”官方表示，提供了两个版本的Claude，Claude和Claude Instant进行商业化交付使用，这是初创公司的 ChatGPT 版本。

Midjourney V5 正在达到人造作品的质量、真实度和细节水平

******\[摘要\]******Midjourney v5 的提示以包含更多自然语言，更自然的语言提示（与单纯的描述符或修饰符相比）,它生成的图像具有双倍分辨率、更高质量和更大的样式范围,最相关的改进可能是轻松获得令人印象深刻的结果。正如许多人预测的那样（St. Pierre 在上面证明了这一点），即时工程可能不需要更长时间的精心制作来获得有竞争力的图像质量。

谷歌正在通过 API 开放 PaLM

********\[摘要\]********Sundar Pichai对 PaLM API 感到兴奋：开发人员在我们的语言模型和 MakerSuite 之上构建的一种简单而安全的方法，这是一种快速启动原型制作的工具 - 今天都提供私人预览。客户还可以通过 Vertex AI 访问这些模型和更多模型。

斯坦福羊驼和羊驼-LoRA  

******\[摘要\]******Stanford Alpaca是一种基于 Meta 的 LLaMA (7B) 的指令调优模型。它以一小部分成本实现了 GPT-3.5 性能。“在我们对单轮指令跟随的初步评估中，Alpaca 的行为在质量上与 OpenAI 的 text-davinci-003 相似，同时出奇的小且易于/便宜地复制（<600 美元）。”Alpaca-LoRA是 Alpaca 的 Low-Rank Adaptation 版本，即它包含在消费类硬件上重现结果的代码。本地部署 GPT-3.5 级别语言模型的时代已经到来。

Runway 宣布推出Gen-2 ：一种多模态 AI 系统

******\[摘要\]******可以从文本中生成逼真的视频。这就像在不拍摄任何东西的情况下拍摄新事物。Gen-2 提供多种模式。(1) 方式一：文字转视频。(2) 模式 2：文本 + 图像转视频 (3) 模式 3：图像转视频 (4) 模式 4：风格化 (5) 模式 5：故事板 (6) 模式 6：蒙版 (7) 渲染 (8) 模式 8 : 定制。

第一个开源Text2video 17亿参数扩散模型已经发布  
******\[摘要\]******ModelScope 建立在“模型即服务”(MaaS) 的概念之上。它旨在汇集来自 AI 社区的最先进的机器学习模型，并简化在实际应用程序中利用 AI 模型的过程。此存储库中开源的核心 ModelScope 库提供了允许开发人员执行模型推理、训练和评估的接口和实现。

Metaview -人工智能生成的自动化采访笔记

******\[摘要\]******Metaview 利用 GPT 和其他基于 Transformer 的 LLM 来创建由 AI 生成的自动化面试笔记。Robinhood、Replit、Scale 和 Brex 等公司使用 Metaview 来节省大量输入面试笔记的时间，并专注于与候选人的高质量互动。

ChatGLM能写文言文致辞，知道何恺明最新动态

******\[摘要\]******据官方介绍，ChatGLM参考了ChatGPT的设计思路，在千亿基座模型GLM-130B中注入了代码预训练，通过有监督微调等技术来实现人类意图对齐。

**李开复正在筹组AI2.0公司，不只要做中文版ChatGPT,正在建设Project AI 2.0** 

******\[摘要\]******这是一家人工智能公司，将开发 ChatGPT 风格的应用程序和人工智能生产力工具。AI 2.0 将建立在当今当前的 AI 聊天机器人和工具之上。随着人工智能从1.0版本升级到2.0版本，公司将打造面向新时代的人工智能平台和生产力应用。Lee 表示，该项目“不仅仅是中国版的 ChatGPT”。人工智能 2.0 可能是“21 世纪提高社会生产力的最重要的赋能技术”，Lee 说。新公司目前正在寻找自然语言处理、多模态和分布式计算等领域的全球人工智能人才。

微软旗下的语音识别公司 Nuance Communications 发布了一款GPT 增强型应用程序，该应用程序可为医生收听并生成患者笔记

\[摘要\]名为 Dragon Ambient Experience (DAX) Express 的临床文档应用程序依赖于 OpenAI 最新的大型语言模型 GPT-4。DAX 人工智能技术“倾听”医患对话，并根据就诊情况生成临床笔记草稿。在患者预约后不久，医疗记录可供审查并嵌入电子记录中。Azure 集成的 DAX Express 将于今年夏天推出私人预览版。

Together宣布 OpenChatKit

\[摘要\]在 Together，我们相信开源基础模型可以更具包容性、透明性、稳健性和能力。我们在 Apache-2.0 许可下发布OpenChatKit 0.15，可以完全访问源代码、模型权重和训练数据集。这是一个社区驱动的项目，OpenChatKit 提供了一个强大的开源基础，可以为各种应用程序创建专用和通用聊天机器人。我们与LAION和Ontocord合作创建了训练数据集。这不仅仅是一个模型发布，这是一个开源项目的开始。我们正在发布一套工具和流程，用于通过社区贡献进行持续改进。

通用汽车希望为司机带来类似 ChatGPT 的助手  
****\[摘要\]****据知情人士透露，生产雪佛兰、凯迪拉克、别克和 GMC 汽车和卡车的通用汽车公司正在开发一款虚拟个人助理，该助理使用 ChatGPT 背后的人工智能模型。声控聊天机器人将使用微软的 Azure 云服务，该服务拥有为 ChatGPT、图像创建者 DALL·E 和微软的 Bing 聊天机器人提供支持的 OpenAI 技术的专有权。通用汽车软件定义车辆和操作系统副总裁 Scott Miller 证实了一些细节，包括该公司正在开发一个人工智能助手，他说这可能会超越当今汽车可用的简单语音命令。

GrammarlyGO添加类似 ChatGPT 的 AI，以您的写作风格、大纲等创建文本

****\[摘要\]****与 ChatGPT 一样，GrammarlyGO 能够根据简短的提示创建文本，尽管 Grammarly 的特殊技巧是生成的内容会复制您通常的写作风格——毕竟，Grammarly 已经分析了您所写的所有拼写错误，因此有大量数据可供使用. Grammarly 指出的用例包括根据“我不感兴趣”等一键式提示编写电子邮件回复。Grammarly 还表示，其生成式 AI 工具能够重写现有内容以辅助语气或清晰度，，以及采用现有内容并延长或缩短它以适应特定的字数。

Adept 筹集了 3.5 亿美元用于构建可学习如何为您使用软件的 AI  
\[摘要\]Adept 是一家 AI 初创公司，构建将纯文本转化为计算机操作的软件，以超过 10 亿美元的估值筹集了 3.5 亿美元的 B 轮融资

Google Brain 的一篇最新论文ReAct：Synergizing Reasoning and Acting in Language Models引发了新的思考浪潮  
\[摘要\]提示工程，以及 LLM 的可组合性、可扩展性和增强性。ReAct1(reason, act)是一种使用自然语言推理解决复杂任务的语言模型范例。ReAct旨在用于允许LLM执行某些操作的任务。例如，在MRKL系统中，LLM可以与外部API交互以检索信息。当提出问题时，LLM可以选择执行操作以检索信息，然后根据检索到的信息回答问题。

谷歌研究人员提出了 CoLT5，这是一种长输入 Transformer 模型

****\[摘要\]****它通过使用条件计算建立在这种直觉的基础上，将更多资源投入到前馈和注意力层中的重要标记。他们表明，CoLT5 比 LongT5 具有更强的性能，训练和推理速度更快，在长输入 SCROLLS 基准测试中达到了 SOTA。此外，CoLT5 可以有效且易于处理地利用极长的输入，显示高达 64k 输入长度的强劲增益。

小冰CEO李迪：小冰X-Chain不是中国的ChatGPT

****\[摘要\]****微软在中国广受欢迎的聊天机器人小冰于 2020 年独立出来。随着 ChatGPT 的成功，小冰 CEO 李迪谈到了公司新的 X-Chain of Thought & Action 模型以及未来对大型语言模型的计划，包括对安全和道德问题的丰富讨论。

ChatExcel表现如何？

**\[摘要\]**想做的事就是跳过学习Excel、跳过写函数公式，直接把脑子里的需求变成表格里的内容。不管怎样，历经1年时间，ChatExcel终于发布demo。体验下来，感觉ChatExcel主要有两大特点：连贯性准确性比如之前也有帮人生成Excel公式的工具，excelformulabot能实现这一功能，但它是独立在表格外的，需要自己把单元格带入到给出的公式了。

认识 Claude：Anthropic 与 ChatGPT 的竞争对手

****\[摘要\]****Anthropic是一家由 OpenAI 前员工共同创立的 AI 初创公司，它已悄然开始测试一款名为 Claude 的新的类似于 ChatGPT 的 AI 助手。Anthropic 的团队非常慷慨地授予我们访问权限，并且 Anthropic 社交媒体政策的更新意味着我们现在可以分享我们在 Claude 和 ChatGPT 之间的一些早期非正式比较结果。对比结果发现Claude在知识推理、逻辑推断等方面有着更加出色的表现，尤其是在面对如今语言模型的典型缺陷“风格一致性”的情况下表现尤为突出。

你能以 85,000 美元的价格训练一个 ChatGPT 击败模型并在浏览器中运行它吗？

******\[摘要\]******有人想出了一种更便宜的方法来制作像 GPT-3 这样可以用自然语言理解和书写的语言模型。过去制作它需要花费数百万美元，但现在只需 85,000 美元即可完成。他们还相信，很快这个模型将能够完全在网络浏览器中运行。他们称这种模型为羊驼毛。它还不如 GPT-3，但他们正在努力让它变得更好。他们还找到了一种方法，通过使用一种叫做 ReAct 提示模式的东西，赋予这个模型更多的能力，比如能够搜索互联网或做数学题。总的来说，他们认为这种羊驼模型在未来会非常有用。

GPT-4发布后，其他大模型怎么办？Yann LeCun：增强语言模型或许是条路

******\[摘要\]******增强语言模型的东西可以帮助我们解决一些复杂的问题。为了做到这一点，我们需要用到一些工具，比如检索器或机械臂。这些工具可以帮助我们获得更多的信息或者直接操作物体。通过将这些工具与语言模型结合起来，我们可以更好地理解和解决问题。同时，我们也可以在训练和使用语言模型的时候，让它们与这些工具交互，从而帮助它们变得更加聪明和强大。

****02＃产品市场创新****

Office全面卷飞:微软正在为 Outlook、PowerPoint、Word 和其他商业应用程序注入一个由 ChatGPT 技术提供支持的人工智能助手

********\[摘要\]********今天，该公司推出了Microsoft 365 Copilot ，该工具可以帮助自动化应用程序中的工作以提高工作效率。其工作场所和生产力软件 Microsoft 365 很快将在其应用程序中配备 Copilot 文本框，用户可以在其中提示 AI 执行诸如编写电子邮件之类的任务。为了提供响应，系统跨 Microsoft 365 帐户访问用户数据，例如过去的电子邮件和文档。为了提高其输出的相关性，Copilot 的大型语言模型可以根据来自各个企业的数据进行训练。

LinkedIn 正在添加用于生成个人资料副本和职位描述的 AI 工具

************\[摘要\]************LinkedIn 正在为其平台添加更多人工智能功能，包括为用户个人资料推荐文本的能力。该公司还在测试一种人工智能工具，该工具可以加快编写职位描述的过程

AI 和 Google Workspace 的新时代****  
******\[摘要\]**********Workspace 用户能够利用生成式 AI 的力量以前所未有的方式进行创建、连接和协作。首先，我们在 Docs 和 Gmail 中向受信任的测试人员介绍了第一组 AI 支持的写作功能。作为世界上最受欢迎和最安全的云原生通信和协作套件，我们非常重视正确并大规模地实现这一点。从我们在 AI 和生产力方面的丰富经验中我们知道，使用 AI 构建功能需要非常谨慎、周到的实验以及用户反馈驱动的多次迭代。作为对 ChatGPT 和微软的巨大回应，谷歌进入了人工智能领域。 

多邻国接入GPT-4，Microsoft 365 Copilot 发布

**************\[摘要\]**************Duolingo Max 包含 角色扮演 ('Roleplay') 和 问答功能 ('Explain My Answer')，从而模拟真实对话并巩固学习成果，该服务将首先面向 iOS 用户推出，Android 版和 web 版则将于晚些发布。目前的两个功能主要还是围绕多邻国的课程设计进行。角色扮演功能，允许用户与AI角色练习真实世界的对话技巧。例如，你可以假装在巴黎的咖啡馆点咖啡。目前角色扮演zh的聊天的场景和对象由多邻国提供，主要围绕用户当前的课程进度。

**03＃合规**

AI 和版权：发起人类艺术运动以支持词曲作者和音乐家的权利

************\[摘要\]************AI 技术的快速兴起开启了一个关于版权和创作者权利的脑洞大开的世界——例如，如果David Guetta 放出一首带有 ChatGPT 生成的假埃米纳姆歌词的歌曲，谁会得到报酬？\- 可以肯定地说，音乐行业对这个充满新挑战的世界感到震惊。周四在西南偏南会议上宣布了一个名为“人类艺术运动”的新联盟来迎接这些挑战，得到了 40 多个组织的支持，包括唱片学院、美国国家音乐出版商协会、美国唱片业和许多其他组织.  

美国版权局称 AI 从文本生成的图像不是人类作者

************\[摘要\]************美国版权局警告说，在昨天发布的新指南中，仅根据文本提示生成的图像不符合人工创作的条件。

《赛博朋克：桃子约翰》这是日本第一部人工智能生成的漫画。但它是艺术吗？

********\[摘要\]********撰稿人杉浦夏美、CNNEmiko Jozuka、CNN 在他的最新漫画《赛博朋克：桃子约翰》中，漫画作者 Rootport 想象日本民间传说英雄桃太郎——据说他是从一个巨大的桃子中诞生的——生活在一个反乌托邦的未来。 “

****GPTs：大型语言模型对劳动力市场影响潜力的早期观察****

********\[摘要\]********OpenAI 研究人员调查了生成式预训练转换器 (GPT) 模型和相关技术对美国劳动力市场的潜在影响。他们的研究结果表明，大约 80% 的美国劳动力至少有 10% 的工作任务会受到 GPT 的引入影响，而大约 19% 的员工可能会看到至少 50% 的工作任务受到影响。


---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20230322-ai2023322](https://www.haxitag.com/briefs/ai-brief-20230322-ai2023322)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。