# AI及信息技术应用2023年3月3日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，能够执行通常需要人类智能才能完成的任务，如视觉识别、语言理解和决策制定。

## 2. 核心洞察 (TL;DR)
- Notion 推出 AI 功能，提供扩写、精简、翻译等文本处理服务。
- OpenAI 推出 whisper APIs，提供低成本的语音到文本转录服务。
- ChatGPT API 被多个平台采用，包括 Instacart、Shopify 和 Snapchat。

## 3. 关键事实与数据
- Notion AI 功能每月收费 10 美元，提供 20 次免费试用。
- Whisper API 价格为每 1000 token 2 美分。
- ChatGPT API 的 Gpt-3.5-turbo 模型已被多个平台集成使用。

## 4. 深度分析正文


AI及信息技术应用2023年3月3日简报
====================

过去这两周，基于ChatGPT相关应用、创新体验或者产品、可能的未来的畅想，十分丰富。尤其是Notion的接入体验，无比流畅，就想起我们曾经跟某笔记、某知识管理协同办公的合作洽谈，感慨万千。  

在众多丰富的创新应用的市场机会里，OpenAI直接放出了支持私有化模型、在线服务2美分一次1000token调用的SaaS服务定价，简直太酸爽了。创造者们可以低成本创造新的体验和价值了，而同业们则更加被边缘化了。

01＃AI应用

Notion 现在允许任何人使用其 AI 功能  
**\[摘要\]**你现在可以试用 Notion 笔记应用程序的 AI 功能，提供了扩写、精简、翻译等AI功能，深度与Notion原有的功能进行结合。Notion AI是需要单独付费的一个月10美元，每个人貌似有20次的免费试用次数。这些功能旨在帮助你编写和完善文本，总结现有笔记中的要点，并生成任务列表，根据以公司公告为准。

OpenAI提供whisper APIs，一个ASR服务  
**\[摘要\]**AI 模型 Whisper 添加了一个语音到文本的 API，其价格几乎是我们能找到的下一个最便宜的语音到文本转录服务成本的 1/3。 

高通在移动设备上演示了使用 Stable Diffusion 生成最快的本地 AI 图像  
**\[摘要\]**Qualcomm 正在展示其在移动设备上的 AI 技术，展示了它声称是智能手机上 AI 图像生成器 Stable Diffusion 有史以来最快的部署。在演示视频中，Qualcomm展示了 1.5 版的 Stable Diffusion 在 15 秒内生成了 512 x 512 像素的图像。

ChatGPT API :Instacart、Shopify、Snapchat 和 Quizlet 已经在使用它了！  
**\[摘要\]**希望很快能在每款产品中看到这些 AI 助手和聊天机器人。宣布这一消息的同时，有消息称 ChatGPT 已经为 Instacart 的杂货店购物助手、Shopify 的 Shop 应用程序的一般购物、Quizlet 的学习和 Snapchat 的陪伴提供了支持。  
  
Anthropic 现在向 Quora、Robin AI 和其他商业企业提供其人工智能文本生成模型  
**\[摘要\]**Anthropic是一家由前 OpenAI 员工共同创立的热门 AI 初创公司，它已开始向合作伙伴提供其 AI 文本生成模型的访问权限。第一个宣布整合 Anthropic 模型的商业企业是Robin AI，这是一家法律科技初创公司，从 Plural、Episode 1 和 Google Black Founders Fund 等投资者那里筹集了超过 1300 万美元。Quora 针对 iOS 和 Android 的实验性聊天机器人应用程序Poe使用 Anthropic 模型，但目前尚未货币化。Robin 首席执行官 Richard Robinson 透露了一些关于 Anthropic 关系的细节，但他告诉 TechCrunch，Robin 致力于在法律文本数据集上微调 Anthropic 模型，以起草和谈判合同。

YouTube 将为视频创作者添加人工智能工具  
**\[摘要\]**谷歌的视频网站计划包括新的视觉人工智能功能，并带有“周到的护栏”, 给 YouTube 社区的第一封信中写道。他解释说，YouTube 创作者将很快能够在“未来几个月”通过 AI 的生成能力虚拟地交换视频中的服装或创建“梦幻般的电影场景”。

谷歌面向代码级神经架构搜索的语言模型**  
**\[摘要\]****EvoPrompting 将进化搜索(evolutionary search)与软提示微调(soft prompt-tuning)相结合，在各种机器学习任务中创建准确和高效的神经网络架构。EvoPrompting 方法提高了语言模型的少样本/上下文能力，发现了新的和有竞争力的神经架构；在 MNIST-1D 和 CLRS 算法推理基准任务上，EvoPrompting 优于人工设计的和单纯的少样本提示法；EvoPrompting 具有足够的通用性，可以很容易地适用于搜索 NAS 以外的其他类型推理任务的解决方案；未来的工作可以扩大 EvoPrompting 的规模，与更有竞争力的大规模架构进行比较，如 Transformer。

Open AI开放ChatGPT模型API，“全民AIGC大时代”要来了！  
**\[摘要\]**3月2日，Open AI在官方博客宣布，开放了ChatGPT和Whisper的模型API，用户可将其集成在应用程序等产品中。ChatGPT API 此次Open AI开放的ChatGPT API模型是Gpt-3.5-turbo。注意， Open AI开放的是ChatGPT模型的API,此次Open AI放大招对于企业、AIGC（人工智能生成内容）创业者、个人开发者来说都是一个极大的利好，进一步降低了技术研发成本。

Amazon 的新框架Multimodal-CoT  
**\[摘要\]**经过 10 亿个参数训练，比之前最先进的 LLM (GPT-3.5) 提高了 16%，达到了惊人的准确率91.68% 与 GPT 的 75.17% 相比。该框架将推理过程分为两个阶段：基本原理生成和答案推理。该模型通过在两个阶段都包括视觉方面来产生更有说服力的论据，这有助于创建更精确的答案推断。这项工作是同类研究中第一个以不同方式研究 CoT 推理的工作。

ChatGPT 在亚马逊上掀起 AI 电子书热潮  
**\[摘要\]**纽约州罗彻斯特的一名推销员席克勒使用可以根据简单提示生成文本块的 AI 软件，Schickler 在几个小时内制作了一本 30 页带插图的儿童电子书，并于 1 月份通过亚马逊公司(AMZN.O)的自营网站发售。截至 2 月中旬，亚马逊 Kindle 商店中有 200 多本电子书将 ChatGPT 列为作者或合著者，包括“如何使用 ChatGPT 编写和创建内容”、“家庭作业的力量”和诗集“Echoes of宇宙。” 而且这个数字每天都在上升。亚马逊上什至有一个新的子类型：关于使用 ChatGPT 的书籍，完全由 ChatGPT 编写。

Buzzy Storytelling Startup Tome 从 AI 名人录中筹集了 4300 万美元  
**\[摘要\]**Tome 是一家利用生成式 AI 帮助用户创建宣传材料的初创公司，以 Lightspeed 领投的 3 亿美元估值筹集了 4300 万美元的 B 轮融资；据《福布斯》消息来源称，这家初创公司仍未盈利。

谷歌可能会将 Imagen AI 图像生成器添加到 Gboard 键盘  
**\[摘要\]**根据9to5Google的一份报告，谷歌有望在今年发布一系列人工智能功能，Android 版 Gboard 可能正在努力集成Imagen 文本到图像生成器。Imagen是 Google 的 AI 文本到图像生成器，类似于 OpenAI 的图像生成器 DALL-E 2。在上周的 Android Package Kit (APK) 拆解中，9to5Google透露最新的 Gboard 测试版包含提到“Imagen Keyboard”的代码行。

OpenAI推出新业务模式：售卖Model instance  
**\[摘要\]**OpenAI悄悄启动了一套全新开发者平台，允许客户使用专用容量运行OpenAI的新型机器学习模型，包括GPT-3.5。此外，Foundry还会提供一定程度的版本控制，由客户决定是否升级到更新的模型版本，并为OpenAI的新模型提供“更健壮”的微调。根据用户在Twitter上亮出的早期截屏画面，OpenAI即将发布的这款产品名为Foundry，号称“专为运行更大工作负载的顶级客户而设计”。

论文版「ChatGPT」来了！看论文问问题可同时进行  
**\[摘要\]**这个小工具名叫ResearchGPT，项目已经开源，在GitHub已经标星400次。直接让这个工具帮你看，有什么问题直接问它就好了。而你全程要做的就只有上传论文和问问题。也没关系，给出的答案都已经清楚地标注了是从论文哪页哪个地方得到的答案，随时可考。

LLaMA：一种来自 Meta AI - FAIR 的新型开源、高性能大型语言模型  
**\[摘要\]** LLaMA（大型语言模型 Meta AI），这是一种最先进的基础大型语言模型，旨在帮助研究人员推进他们在 AI 子领域的工作。更小，更高性能的模型，如LLaMA，使研究界中无法访问大量基础设施的其他人能够研究这些模型，进一步使这个重要的，快速变化的领域的访问民主化。LLaMA实际上是7B到65B参数的基础语言模型的集合。这些模型已经在数万亿个令牌上进行了训练，并表明可以仅使用公开可用的数据集来训练最先进的模型，而无需诉诸专有和不可访问的数据集。 LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B)，而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。

Nvidia 宣布了一项AI 云服务，供客户通过网络浏览器访问其 AI 超级计算机功能  
**\[摘要\]**Nvidia 正在与云提供商 Microsoft、Google 和 Oracle 一起推出“DGX Cloud”服务。 “AI即服务”旨在为企业在ChatGPT热情高涨的情况下开发自己的AI模型提供更强大的计算能力。

AI绘画的新方向：一站式项目管理，试用KreaAI的新画布！  
**\[摘要\]**前段时间曾经提到目前AIGC领域比较热的是在自训练模型方面，各家第三方平台纷纷推出了自己的自训练模型，模型已经成为第三方的一个竞争力，但第三方平台也都在努力做出差异化服务，用户也在期待除自训练模型之外能有更多的新型服务。近日Krea AI推出了一个新的画布功能，包含了15个自定义的AI模型，以及图像变化（Variations）、外扩（Out painting）、放大（Upscaling）、背景去除等功能。

Google Photos 的 AI 驱动的“魔法橡皮擦”现在是 Google One 订阅福利  
**\[摘要\]**Google 正在向所有 Pixel 所有者和 Google One 订阅者开放 Magic Eraser 照片编辑工具和其他功能；云存储订阅服务的所有用户都将能够使用 AI 驱动的 Magic Eraser 从图像中删除不需要的对象。

Composer-阿里发布的图像生成模型  
**\[摘要\]**Composer是一个大型的（50亿个参数）可控扩散模型，在数十亿个（文本、图像）对上训练。它可以通过组合以指数方式扩展控制空间，导致产生和操纵图像的大量方法，即使有限的手段得到无限的利用。

Copilot hub-基于公开内容训练AI机器人  
**\[摘要\]**通过一些公开的信息和内容训练对应名人的AI让你直接同他们对话获得相关启发，现在以及提供了类似纳瓦尔、乔布斯、苏格拉底等人的AI。

BioGPT：用于生物医学文本生成和挖掘的生成式预训练转换器  
**\[摘要\]**BioGPT是一种在大规模生物医学文献上进行预训练的特定领域生成式 Transformer 语言模型。我们在六项生物医学自然语言处理任务上评估了 BioGPT，并证明我们的模型在大多数任务上优于以前的模型。特别是，我们在 BC5CDR、KD-DTI 和 DDI 端到端关系提取任务上分别获得了 44.98%、38.42% 和 40.76% 的 F1 分数，在 PubMedQA 上获得了 78.2% 的准确率，创造了新的记录。我们关于文本生成的案例研究进一步证明了 BioGPT 在生物医学文献上的优势，可以为生物医学术语生成流畅的描述。

贝恩公司宣布与 OpenAI 建立服务联盟，帮助企业客户发现并实现人工智能的全部潜力和最大价值  
**\[摘要\]**全球合作伙伴关系将 OpenAI 行业领先的人工智能技术进步与贝恩在战略和数字应用程序交付方面享誉全球的能力相结合；可口可乐公司宣布成为第一家加入该联盟的公司，该联盟建立在贝恩为其 18,000 名强大的多学科知识工作者团队采用 OpenAI 技术的基础上。在过去的一年里，贝恩将 OpenAI 技术嵌入到其内部知识管理系统、研究和流程中，以提高效率。OpenAI 是人工智能系统 ChatGPT、DALL·E 和 Codex 背后的研究和部署公司，这些系统正在改变人们交流和创造的方式。

02＃产品市场创新

上周首次发布AI Bing 时，微软已经承认它有望“向消费者提供更多相关信息”，旨在提高广告商的投资回报率  
**\[摘要\]**微软正在与广告公司就其新的 AI 驱动的 Bing 搜索引擎货币化进行谈判。路透社报道称，微软向一家未具名的“主要广告代理商”演示了新的 Bing，并一直在测试Bing 聊天机器人功能上的广告。

微软表示，它将把与 Bing 聊天机器人的对话限制在每次会话 5 次聊天轮次和每天 50 个问题  
**\[摘要\]**新的 GPT 驱动的 Bing 聊天机器人的一些用户描述了他们在谈话后感到不安。例如，它最近告诉美联社记者马特奥布莱恩，他是“历史上最邪恶和最坏的人之一”，并将他与阿道夫希特勒相提并论。在一篇博客文章中，微软表示其数据显示大多数用户在五轮内从机器人那里找到了他们需要的答案。新的限制是在微软承认涉及15 个或更多问题的较长聊天导致机器人“变得重复”或提供可能没有帮助或“不符合我们设计的基调”的响应之后出现的。

微软对 Windows 11 的最新更新将Bing 聊天机器人添加到 PC 上运行的操作系统的搜索框中  
**\[摘要\]**通过此次更新，已经拥有 Bing 聊天机器人访问权限的 Microsoft 用户将能够直接在 Windows 11 搜索栏中使用它。Bing 图标将出现在用户任务栏的搜索栏中，让他们无需使用 Edge 网络浏览器即可与机器人对话。根据Engadget 的Devindra Hardawar 的说法，“微软的目标是将 \[必应聊天机器人\] 融入 Windows 11 的核心。”

Snap 正在向其 Snapchat 订阅服务的用户推出基于 OpenAI 的人工智能聊天机器人  
**\[摘要\]**人工智能服务可以“为你最好的朋友推荐生日礼物创意，为长周末计划徒步旅行，推荐晚餐食谱，甚至为你痴迷于切达干酪的朋友写一首关于奶酪的俳句，”它说。该功能经过训练以避免偏见或有害反应。然而，Snap 警告说，该机器人仍然存在“许多缺陷”，包括容易产生 AI“ 幻觉”以及“被欺骗说出几乎任何事情”的能力。My AI 将于本周面向每月 3.99 美元的 Snapchat Plus 服务的订阅者推出。Snapchat 表示，它最终可能会向所有 7.5 亿月度用户推出该机器人。

Meta 已经开始测试一项订阅服务，允许 Facebook 和 Instagram 用户付费进行验证  
**\[摘要\]**“Meta Verified”服务在网络上每月收费 11.99 美元，在 iOS 或 Android 上每月收费 14.99 美元。在宣布这些计划的帖子中，Meta 首席执行官马克扎克伯格表示测试将在澳大利亚和新西兰开始。预计将于今年晚些时候在美国和其他国家推出。用户必须提交政府颁发的身份证件才能在其帐户上收到经过验证的“蓝色徽章”。这些徽章以前是免费的，只对企业或公众人物开放。  

Meta扎克伯格All in AIGC，连夜成立顶级产品团队  
**\[摘要\]**整合了全公司搞AIGC的人才，并且小扎称要把相关技术注入到Meta所有的产品中。例如要把AIGC中的文本生成、对话能力，用到自家的WhatsApp、Messenger等；图像生成能力要用到Instagram；以及还要探索视频和多模态的玩法。小扎还为这个大动作设定了2个目标：短期目标：打造具有创造性和表现力的工具。长期目标：开发能够用各种方式帮助人们的AI角色。而就在前几天，Meta还刚刚发布了自家的大语言模型LLaMA；技术、产品团队均已就绪，Meta这波俨然一副All in AIGC的节奏。

03＃监管合规

OpenAI 发起改进 ChatGPT 的计划  
**\[摘要\]**OpenAI LLC 正在发起一项计划，以提高 ChatGPT 的透明度，提高人工智能模型提供的答案的质量，并使其为用户定制。OpenAI 依靠人工审阅者来微调 ChatGPT 生成的答案的准确性。为了提高流程的透明度，这家初创公司发布了部分指导方针，为审稿人提供有关政治和有争议话题的指导方针。这份日期为 2022 年 7 月的三页文件概述了 OpenAI 关于此类主题的政策，以及有关用于改进 ChatGPT 响应的内部工作流程的信息。  
  
罗马尼亚政府推出了一个人工智能“顾问”平台，该平台可以收集该国公民的意见并将其反馈给公职人员  
**\[摘要\]**具体来说，人工智能平台将分析人们通过ion.gov.ro网站发送的消息，并生成报告，为罗马尼亚人建议优先事项。“我们正在谈论第一位使用人工智能的政府顾问，”罗马尼亚总理尼古拉丘卡说。周三，丘卡向他的内阁展示了名为“Ion”的人工智能技术。Ion 在罗马尼亚语中是“约翰”的意思，他可以“倾听所有罗马尼亚人的意见，并在罗马尼亚政府面前代表他们，”他说。在公开会议上，Ion 向立法者“介绍”了自己，说：“你好。你给了我生命。我是 Ion。现在，我的角色是代表你。就像一面镜子。”

人工智能图像生成器 Midjourney 通过禁止有关人类生殖系统的词语来阻止色情内容  
**\[摘要\]**Midjourney 的创始人大卫·霍尔兹 (David Holz) 表示，它禁止使用这些词作为权宜之计，以防止人们在公司“改进 AI 方面的事情”时产生令人震惊或血腥的内容。Holz 说版主会观察文字的使用方式以及生成的图像类型，并定期调整禁令。该公司有一个社区指南页面，列出了它以这种方式阻止的内容类型，包括性图像、血腥，甚至是经常被用作臀部符号的表情符号。

Twitter更新暴力言论政策以禁止“伤害愿望”  
**\[摘要\]**新政策禁止用户表达“伤害意愿”等类似情绪。“这包括（但不限于）希望他人死亡、遭受疾病、悲惨事件或经历其他对身体有害的后果，”规则状态. 这与 Twitter 之前的政策相反，该政策明确表示“表达希望或希望某人遭受身体伤害的声明”并不违反公司的规定。“表达希望或希望某人遭受身体伤害的陈述、模糊或间接的威胁，或不太可能造成严重或持久伤害的威胁行为，根据本政策是不可采取行动的，”Twitter 之前的政策陈述，根据 Wayback Machin。

媒体：花旗、高盛限制员工们使用ChatGPT  
**\[摘要\]**知情人士称，花旗集团已经阻止了员工对该产品的访问。同时，另一位知情人士也表示，高盛集团的交易员也受到了类似的限制。此前，摩根大通似乎也限制了员工们使用ChatGPT，原因是公司担心员工们与ChatGPT共享敏感的金融信息可能会引发监管行为。ChatGPT是美国OpenAI公司研发的聊天机器人程序，可以完成撰写邮件、报告、翻译等任务。  
  
ChatGPT:在人工智能时代调节信息失真  
**\[摘要\]**关于我们应该如何监管Twitter、YouTube和Facebook等社交媒体平台上的虚假信息和错误信息，人们一直在争论不休。然而，这些努力，包括聘请政策专家和投资技术以限制虚假信息传播者，在科技行业持续的裁员浪潮中已经减弱。"近年来，社交媒体上的信息失真一直是一个重要的问题，对公众话语的影响越来越大。虽然社交媒体上的虚假信息监管的未仍不确定，但人们对ChatGPT等人工智能工具感到担忧，这是一种人工智能聊天机器人，经过大量数据训练，用于生成答案。关于我们应该何监管 Twitter、YouTube 和 Facebook 等社交媒体平台上的虚假信息和错误信息，一直存在争论。ChatGPT 的强大性质、它增加虚假信息的潜力以及它对国家安全和教育的影响，引发了与何监管这些工具有关的问题。令人惊讶的是，ChatGPT 本身已经提出了一些潜在的策略和重点领域监管虚假信息。

调查称部分企业开始用 ChatGPT 取代员工  
**\[摘要\]**Resumebuilder.com 调查了 1000 名计划使用或已经使用 ChatGPT 的企业领导人，发现近半数企业部署了 ChatGPT，部分企业还表示已经开始用 ChatGPT 取代员工。企业高管谈论了 ChatGPT 的用途，其中 66% 用于写代码，58% 用于文案和内容创作，57% 用于客户支持，52% 用于写会议摘要和其它文档。在招聘过程中，使用 ChatGPT 的企业还有 77% 用它撰写工作职位描述、66% 用它起草面试申请书，65% 回应求职书。大部分企业领导人对 ChatGPT 的表现印象深刻，55% 的人认为工作质量“出色”，34% 的人认为“非常好”。几乎所有使用 ChatGPT 的公司表示节省了资金，48% 表示节省逾 50,000 美元，11% 表示节省逾 100,000 美元。这些企业中 93% 还计划扩大对 ChatGPT 的使用。

香港大学宣布禁用 ChatGPT 等 AI 工具  
**\[摘要\]**港大副校长何立仁向教职员及学生发内部信，称 ChatGPT 是令全球教育界震荡的语言模型，将采取短期措施，禁止校内所有课堂课程作业和评估等使用 ChatGPT 或其他人工智能工具，如有学生要使用相关应用程序，须获得课程导师书面同意，若有违规，将被视为潜在抄袭。尽管如此，OpenAI 首席技术官 Mira Murati 近期表示，学校不应该禁止 ChatGPT，因为她认为该工具实际上有益于学生的学习。  
  
印度政府建立基于ChatGPT的WhatsApp聊天机器人来帮助农民  
**\[摘要\]**印度政府的电子和信息技术部（MeitY）正在建立一个聊天机器人，该机器人将由ChatGPT驱动，以帮助农村地区的农民获得有关政府关键计划和补贴的信息。MeitY的一个名为"BHASHINI"（"BHASa INterface for India"的缩写）的小团队正在开发这个聊天机器人，其意思是"能说会道"。

---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20230303-ai202333](https://www.haxitag.com/briefs/ai-brief-20230303-ai202333)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。