# AI及信息技术应用2023年8月21日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，能够执行认知任务，如学习、推理、解决问题和感知。

## 2. 核心洞察 (TL;DR)
- 多家公司推出日语语言模型，AI与行业结合成为基座，数据隐私问题成为焦点。
- 麦肯锡推出AI聊天应用Lilli，大型跨国公司利用AI管理供应链。
- 字节和快手发布大语言模型，Stability AI发布ControlNet Lora，Line开源日语语言模型。

## 3. 关键事实与数据
- 麦肯锡的AI聊天应用Lilli基于超十万份文件和访谈记录训练而成，可缩短研究和规划工作所需时间。
- Stability AI将ControlNet模型缩小到700M，使其适用于更多消费级GPU。
- Line开源的日语语言模型“Japanese-large-lm”具有36亿个参数，对研究界和企业有重大影响。

## 4. 深度分析正文


AI及信息技术应用2023年8月21日简报
=====================

本周发生的AI应用领域的两个新现象，有多家公司单独推出了日语语言模型。其次，就是LM逐渐成为跟行业结合的基座，比如供应链、科研、社交等，通过与领域语言文本的样本进行专用特性的微调，正成为领域内知识助理，帮助行业应用大幅提升效率和效能。  

另一个热门话题就是人工智能的数据隐私问题，除了数据脱敏，更多的还是私有数据不能出企业应用的授权范围，包括应用人群、也包括程序化度调用。哈希泰格的LM（阅粒知识计算引擎）解决方案中就私有化部署和数据管理的框架严格权限控制和隔离。  

**1，AI应用**  

麦肯锡推出其首款AI聊天应用Lilli

\[摘要\]咨询公司麦肯锡(McKinsey & Company)宣布推出其首款AI聊天应用Lilli。该工具在麦肯锡CTO Jacky Wright领导下开发，基于超十万份文件和访谈记录训练而成，能够就咨询项目提供见解、数据、制定计划，甚至推荐内部专家。目前，Lilli主要供公司内部一部分员工使用，将在今年秋季全公司推广。自6月份开始测试以来，已有大约7000名员工试用过Lilli。这些员工能够借助Lilli将研究和规划工作所花费的时间从几周缩短到几小时，或将需要几小时的任务缩短到几分钟完成。

大型跨国公司转向生成式人工智能来管理供应链

\[摘要\]据 FT 消息，包括联合利华、西门子和马士基在内的一些世界上最大的公司，越来越多地利用人工智能（AI）来应对复杂的供应链问题，并解决与地缘政治紧张局势、环境和人权问题相关的挑战。这项技术使得与供应商的沟通和谈判更加迅速，尤其是在中断时期。西门子利用Scoutbee 的聊天机器人可以找到备选供应商或者用户供应链中的弱点，解决供应链管理中的地缘问题。Pactum使用类似 ChatGPT 的机器人代表马士基、沃尔玛和 Wesco 与供应商协商合同，这项技术使得与供应商的沟通和谈判更加迅速，尤其是在中断时期。Altana 开发了一个分析海关申报、航运文件和其他数据的平台，以创建连接全球 5 亿家公司的全面地图。这个工具允许客户追溯产品到特定地区的供应商，并跟踪自己的产品以降低风险和确保负责任采购。

Perplexity 上周发布了他们的新品牌 logo 和品牌定位“世界的研究助手”

\[摘要\]知识就是力量。体验我们的新品牌，旨在释放我们的好奇心，一次提问是一个问题。发现知识并探索无尽的可能性。

快手也在上周公布了自己的 LLM “快意（KwaiYii）”

\[摘要\]在 github 页面里表示在最新的 CMMLU 中文排名中拿下第一名。目前除了一些评分没有公开更多信息。其他的内容可以在他们的 github 页面查看。目前基于快意模型开发的对话模型已经在安卓客户端开启了内测。

字节和快手都发布了自己的大语言模型

\[摘要\]字节的机器人是以单独应用的形式推出的叫“豆包”，有网页端、iOS 和安卓客户端，可以访问https://www.doubao.com/chat 通过抖音授权登录使用。iOS 端需要通过TestFlight安装，直接用 iOS 打开上面链接就行。模型是基于字节的云雀大模型开发的。目前预置了英语学习助手和写作助手两个功能，还有一个爱聊天小宁估计是单独用作聊天陪伴的微调模型。

Stability AI 发布了 ControlNet Lora 将 ControlNet 模型缩小到 700M

\[摘要\]上周 Stabilty AI 发布了 ControlNet Lora，通过将低秩参数有效调整添加到ControlNet中，这种方法提供了一种更有效、更紧凑的方法，可以将模型控制扩展到更多消费级GPU。将原始4.77G的 ControlNet 模型缩小到了 738M，这次他们发布了四个ControlNet Lora模型。这次的模型会先在ComfyUI 和 StableSwarmUI 中提供。

Line 开源“japanese-large-lm”：具有 36 亿个参数的日语语言模型

\[摘要\]LINE 的 Massive LM 开发部门宣布以开源软件 (OSS) 的形式发布日语模型“ Japanese-large-lm”。此版本将对研究界和寻求利用尖端语言模型的企业产生重大影响。

ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

\[摘要\]为了促进开源LLM的工具使用能力，我们引入了 ToolLLM，这是一个数据构建、模型训练和评估的通用工具使用框架。收集了 16 个，RapidAPI Hub 提供 464 个真实世界的 RESTful API，涵盖 49 个类别，然后提示 ChatGPT 生成涉及这些 API 的各种人工指令，涵盖单工具和多工具场景。最后，我们使用 ChatGPT 为每条指令搜索有效的解决方案路径（API 调用链）。为了使搜索过程更加高效，我们开发了一种新颖的基于深度优先搜索的决策树（DFSDT），使法学硕士能够评估多个推理轨迹并扩展搜索空间。我们证明 DFSDT 显著增强了LLM的规划和推理能力。为了有效评估工具使用情况，我们开发了一个自动评估器：ToolEval。我们在ToolBench上微调LLaMA并获得ToolLLaMA。我们的 ToolEval 揭示了 ToolLLaMA 表现出执行复杂指令和泛化到未见过的 API 的非凡能力，并表现出与 ChatGPT 相当的性能。为了使管道更加实用，我们设计了一个神经 API 检索器来为每条指令推荐合适的 API，从而无需手动选择 API。

Marqo，一个用于 AI 应用的开源矢量搜索引擎

\[摘要\]Marqo 的核心任务是解决非结构化数据难题，根据一些估计，非结构化数据占所有创建数据的 90%。随着越来越多的人转向生成人工智能来回答他们的在线查询或创建新的图像和艺术品，这只会加剧对新工具来理解这一切的需求。与现有的现有产品相比，Marqo 的一个核心卖点是它承诺提供开箱即用的全套矢量搜索，包括矢量生成、存储和检索。这意味着 Marqo 允许用户绕过 OpenAI 或 Hugging Face 等第三方矢量生成工具，通过单个 API 提供所有内容。

Stability AI发布了一个他们训练的日语 AI 模型

\[摘要\]Japanese StableLM Alpha。它是目前为日语使用者创建的性能最佳的公开可用 LM。

黄仁勋 SIGGRAPH 2023 主题演讲发布的一些信息

\[摘要\]Grace Hopper超级芯片NVIDIA GH200已于5月份全面投入生产，GH200将具备连接多个GPU的能力。Nvidia 正在与 HuggingFace 合作，帮助开发人员在任何云上创建、测试和微调生成式 AI 模型。因此，开发人员现在可以在 HF 上训练模型并使用 Nvidia 的 AI 工作台进行部署。

IBM Research 最新的用于深度学习推理的模拟 AI 芯片

\[摘要\]IBM 研究人员推出了一款用于 AI 计算的原型模拟芯片，据 IBM 称，该芯片在 CIFAR-10 图像数据集上的得分为 92.81%，比使用类似架构的其他芯片快 15 倍，同时实现了相当的能效。模拟芯片在人工智能计算方面具有与当前数字芯片同样出色的潜力，同时体积更小、能耗更低。

Meta Code Llama：免费代码生成软件

\[摘要\]Meta 的代码生成人工智能模型名为 Code Llama，将开源，最早可能于下周推出。新的编码模型可与 OpenAI 的编码模型相媲美，并建立在 Meta 的 Llama 2 软件之上，这是一种可以理解和生成会话文本的大语言模型。开源的 Llama 2 颠覆了人工智能领域，让公司更容易制作自己的人工智能应用程序，Code Llama 将使公司更容易开发 AI 助手，在开发人员键入时自动向他们推荐代码，并且它可以从付费编码助手（例如由 OpenAI 提供支持的 Microsoft GitHub Copilot）中吸引客户。

人工智能的使用正在渗透到学术期刊中，而且事实证明很难检测到

\[摘要\]生成式人工智能的迅速崛起引发了跨学科的焦虑。高中教师和大学教授担心作弊的可能性。新闻机构因人工智能撰写的劣质文章而被捕。现在，同行评审的学术期刊正在努力应对提交的论文，其中作者可能使用生成式人工智能来撰写大纲、草稿，甚至整篇论文，但未能明确人工智能的用途。期刊正在采取拼凑的方法来解决这个问题。JAMA Network 包括美国医学会出版的刊物，禁止将人工智能生成器列为作者，并要求披露其使用情况。Science出版的期刊系列不允许未经编辑许可使用文本、图形、图像或人工智能生成的数据。PLOS ONE要求任何使用人工智能的人详细说明他们使用了什么工具、如何使用工具以及评估所生成信息的有效性的方式。Nature禁止人工智能生成图像和视频，它需要使用语言模型待披露。许多期刊的政策要求作者对人工智能生成的任何信息的有效性负责。

李志飞：解析大模型时代Agent的未来发展路径

\[摘要\]本文从大模型本身的特点和Agent实际落地中的难点出发,探讨如何把LLM转化为通用的Agent。文章认为,Agent的成功与否,不仅依赖于LLM的「智商」,更需要外部框架来解决环境交互和工具调用问题。文章还讨论了多模态技术对Agent future的影响,以及不同行业面临的 disrupt 风险。文章指出,目前Agent市场格局可能形成长尾,短期内难见强者,需要探索如何打通LLM和外部应用之间的接轨点,才能真正实现Agent的落地。

百度CIO李莹：大模型是企业办公领域的重要机遇，AI的原生重构将改变智能工作方式

\[摘要\]百度集团副总裁兼首席信息官李莹发表了主题演讲，她认为当前以AI大模型为核心技术的第四次科技革命将从根本上推动生产力变革，为各行各业提供强大支持，并为企业办公领域带来前所未有的发展机遇基于AI原生思维，李莹宣布，百度智能工作知识管理理念“创新流水线= AI x知识管理”升级到2.0，正式发布百度如流“超级助理”，并带来百度Comate系列产品的重磅升级。

金融时报关于黑石筹集现金以建造数据中心的新闻

\[摘要\]黑石的高官们认为，这笔投资可能成为其最赚钱的房地产投资之一，大型科技公司正在进行一场人工智能军备竞赛，数据中心将成为未来增长的引擎，并推动巨大的需求。闻

英伟达最近投资的AI初创公司MindsDB的情况

\[摘要\]MindsDB是一个AI虚拟数据库，旨在帮助全球软件开发者在其产品中实现AI能力，以降低开发AI应用的门槛。MindsDB的产品已经整合了130多个数据集成和20多个AI/ML框架集成，并将大模型抽象为虚拟表，使开发者能够轻松构建和维护AI/ML应用程序。MindsDB的创始人认为，AI革命应该让每个开发者都能构建和管理AI模型，并将其嵌入到现有的软件基础设施中。目前，MindsDB的开源产品已有15万个安装部署，其商业付费产品有接近200家企业客户在使用。虽然在早期阶段面临了困难和质疑，但MindsDB通过开源社区的贡献和投资帮助取得了成功。

生成式AI公司Adept AI的独特之处和创新业务模式

\[摘要\]Adept AI团队由谷歌AI研究部门的知名学者和一位华人技术大佬组成。他们认为语言模型不仅可以生成文本内容，还可以创建和执行“动作”，成为新一代操作系统，革新人们和计算机的交互模式。Adept AI的主要目标是基于生成式AI技术构建通用操作工具，让用户可以通过语音或文字指令来完成各种操作和任务。他们已经获得了来自知名投资者的大量融资，并计划推出他们的产品。Adept AI相信未来用户与计算机的交互将主要使用自然语言，而不是图形用户界面。根据《福布斯》的报道，人工智能公司Adept AI在最新融资轮中获得了来自ylock、Atlassian Ventures、微软、英伟达、Workday Ventures、Caterina Fake、Frontiers Capital、PSP Growth、SV Angel等投资者的资金支持，并且估值至少达到10亿美元。

BuboGPT：首次将视觉连接引入LLM

\[摘要\]值得注意的是，通过引入负样本“图像-音频对”进行语义匹配，BuboGPT可以更好地对齐，多模态联合理解能力更强。BuboGPT demo页面功能区一目了然，操作起来也非常简单，右侧可以上传图片或者音频，左侧是BuboGPT的回答窗口以及用户提问窗口：上传好照片后，直接点击下方第一个按钮来上传拆分图片：就拿一张长城照片来说，BuboGPT拆成了这个样子，识别出了山、旅游胜地以及城墙：当我们让它描述一下下这幅图时，它的回答也比较具体，基本准确：可以看到拆分框上的内容也有了变化，与回答的文本内容相对应。

Inflection AI 参与聊天机器人革命，利用 Pi 和 Azure AI 基础设施加快开发时间

\[摘要\]在技术方面，Inflection AI 相信，使用 Azure AI 基础设施可以让公司在未来几年更好地处于领先地位。凭借其可靠稳定的基础设施，该公司大大加快了开发时间并提高了人工智能的效率。正如 Suleyman 指出的那样：“在我们增强和扩展 Pi 的过程中，与 Microsoft 合作对我们来说非常有价值，因为 Azure AI 基础设施的可靠性和规模是世界上最好的。”

Microsoft启动Azure Chatgpt

\[摘要\]为企业量身定制的开源Chatgpt。与Chagpt不同，此版本旨在防止披露知识产权或数据和功能，数据是私人的，并且与OpenAI完全隔离，网络流量可以完全隔离到您的网络，连接您自己的数据服务和来源。

SK电讯拟投资Anthropic 1亿美元 后者被视为OpenAI对手

\[摘要\]韩国最大电信公司SK Telecom日前表示，将向美国人工智能公司Anthropic投资1亿美元，以加强其电信驱动的AI业务。” Anthropic指出，Claude可以帮助处理总结、搜索、创意和协作写作、问答、编码等用例。Anthropic称，“Claude是下一代AI助手，基于Anthropic对训练有用、诚实和无害的AI系统的研究

阿里云开源了两个基于ChatGPT式统一千问的生成式AI模型

\[摘要\]阿里云LLM的标志放在了封闭和开源的边界上，因为它最近开源了它的70亿参数语言模型，所以在我看来它是部分开放部分封闭的.这家中国公司已将其两个大型语言模型 Qwen-7B 和 Qwen-7B-Chat 免费提供给商业和研究用途阿里云将于明年从母公司分拆出来，在全球围绕 ChatGPT 的热潮中，阿里云一直在加倍投资生成式人工智能

**2，产品市场创新**

ChatGPT 获得多项新功能，包括多文档聊天

\[摘要\]OpenAI 为 ChatGPT 引入了新功能，包括随机提示建议以减轻对“空聊天”的恐惧以及跨多个文档聊天的能力，使 AI 模型更加通用和有用。Word、Excel 和 PowerPoint 文件也可以使用。ChatGPT 还不能直接处理 PDF，但这应该是时间问题。

Newegg 的 ChatGPT 支持的评论摘要可以帮助您选择下一个 PC 部件

\[摘要\]Newegg 的新人工智能生成评论摘要可以让您在搜索电脑零件和其他技术时更轻松地筛选用户反馈。除了提供人们对产品评价的简短摘要外，人工智能还根据用户评论挑选出优点和缺点。该功能利用 OpenAI 的 ChatGPT 背后的技术，位于产品页面底部的“评论”选项卡中。在那里，你会看到一个可以点击的优缺点列表，允许你按特定关键字过滤评论，并查看人工智能从哪里获取信息。在其下方，您还会看到人工智能生成的摘要，其中将所有关键反馈片段组合成一个简短的段落。

POE今天上新：thread！

\[摘要\]在POE上的对话现在将被组织成单独的聊天。这使您可以同时进行多次与同一机器人进行多次对话，或者在停止的情况下进行以前的对话。线程在POE和所有平台上的所有机器人都可以使用：iOS，Android，Web和MacOS。

Google推出了一款名为“Poem Postcard”的工具，使用人工智能生成的诗歌创建个性化明信片

\[摘要\]该工具利用了Google艺术与文化网站，你可以挑一件你喜欢的艺术品，然后选个你想要的诗歌类型，比如十四行诗、打油诗，或者俳句什么的。AI会帮你根据艺术品和诗歌类型弄出一首诗来。诗弄好了，你还可以加上自己的信息和地址，甚至在明信片正面加个照片或图像。搞定了就可以打印出来或通过电子邮件发给朋友。

Google测试生活建议类AI助手

\[摘要\]据纽约时报报道，Google正在测试一款可以提供生活建议的人工智能个人助手。Google旗下的DeepMind 和 Brain AI 实验室已经花费了数月来开发该应用。现在正在测试他们工作的成果。Google希望这个助手能够执行至少21种不同类型的个人和职业任务，包括提供生活建议、创意、计划和学习。"创意生成”功能可以根据情况为用户提供建议。“培训”功能可以帮助用户学习新技能或提高现有技能。而“规划”功能则可以制定财务预算，以及营养和健身计划。

Adobe Express 获得 AI 升级

\[摘要\]Adobe 刚刚在其 Express 设计平台上推出了新的人工智能功能，经过数月的 beta 测试，现已向公众开放。用户可以根据 100 多种语言的提示生成自定义图像和文本（使用 Adobe Firefly）。Adobe 能否赶上广受欢迎的 Canva AI?

X可能会发布ID验证

\[摘要\]Twitter实名制了你会愿意继续用吗？X继续进行ID验证。您应该上传ID的照片并进行现场自拍照。

**3，监管与合规**

TikTok 让创作者更轻松地标记人工智能生成的内容

\[摘要\]TikTok 向创作者明确表示，任何人工智能生成的内容都必须被标记。新的标签功能使创作者可以更轻松地披露他们的帖子是否包含任何人工智能制作的内容。现在，上传视频时，可以在“更多选项”下找到标有“人工智能生成内容”的切换开关。”

人类数据告急，OpenAI用AI喂AI，奥特曼：未来所有数据变合成数据

\[摘要\]据《金融时报》介绍，不少公司正把大模型生成的结果、也就是所谓的合成数据（Synthetic data），喂给参数量更小的大模型吃，发现效果还不错。对于使用合成数据，OpenAI的CEO Sam Altman不仅不介意，还放话“未来所有数据都将变成合成数据”。Gretel.ai的CEO Ali Golshan认为，合成数据的好处在于，它保留了数据集中所有个人的隐私，同时仍然保持其统计学意义上的完整性（statistical integrity）。

给大模型测MBTI

\[摘要\]不同模型人格确实不同——GPT-4属于INTJ，ChatGPT属于ENTJ，而70亿参数的Bloom为ISTJ。不过由于资源限制，除了ChatGPT和GPT-4之外，都是一些参数为100亿左右的小模型。于是作者又开始提出第二个问题：能不能通过简单的提示工程改变大模型的人格？

OpenAI 表示人工智能工具可以有效地进行内容审核

\[摘要\]内容审核可能是一项艰巨的任务，该公司与世界各地数千名审核员合作，阻止用户看到儿童色情内容和极端暴力图像等有害内容。OpenAI 表示：“（内容审核）过程本质上是缓慢的，可能会给审核者带来精神压力。” “有了这个系统，开发和定制内容策略的过程从几个月缩短到几个小时。”

纽约时报禁止人工智能抓取

\[摘要\]《纽约时报》更新了其服务条款，禁止使用其内容（包括文本、图像和元数据）来训练人工智能模型。这项措施还限制使用网站爬虫等自动化工具在未经书面许可的情况下访问或收集《纽约时报》内容。

Dynamofl最私密的企业人工智能解决方案 以极低的成本提供一流且符合法规的人工智能

\[摘要\]DynamoFL的隐私专家团队解决了生成AI等技术的数据泄露风险，通过全面渗透测试凸显风险，快速部署隐私增强人工智能以降低泄露风险。安全地利用带有PII的非结构化数据集进行AI，简化团队的合规性，降低成本，节省时间和资源。通过解决合规性障碍，部署快速完成。通过使用DynamoFL超个性化微调大型语言模型，击败性能基准，创造个性化ML，削减数据成本，降低服务器和数据传输成本，在企业数据上构建AI应用。

OpenAI 修复了可能违反 GDPR 的 ChatGPT 错误

\[摘要\]在未经同意的情况下，分配给用户ChatGPT对话的标题被随机暴露给其他用户后，OpenAI 可能违反了GDPR立法。该公司将其描述为第三方开源库的“重大问题” ，现已修复。一位法律专家表示，任何行动都将取决于其他用户帐户中出现的标题造成的损害程度以及该信息包含的内容。奥特曼表示，将对导致故障的原因进行“技术事后分析”，提示和响应中使用的信息可能会用于训练模型，但前提是个人身份信息已被删除。

硅谷夺回无人车中心

\[摘要\]所以之前无人车的商业化难题是：一辆比普通网约车贵得多的自动驾驶车辆+和人类司机工资持平的安全员成本。主驾无人再加上允许收费，不但是为Robotaxi这个物种顺利诞生、成熟扫清了障碍，更是为自动驾驶行业注入了信心，让这些在技术上坚持投入超过10年的玩家们，看到了希望。主驾无人和允许收费放在一起来看，完全扫清了L4以上高阶自动驾驶商业落地的障碍


---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20230821-ai2023821](https://www.haxitag.com/briefs/ai-brief-20230821-ai2023821)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。