# AI及信息技术应用2023年7月23日简报

## 1. 核心定义
> 人工智能大语言模型是一种基于海量数据训练的深度学习模型，能够理解和生成自然语言，应用于文本生成、机器翻译、问答系统等领域。

## 2. 核心洞察 (TL;DR)
- LLAMA2和百川130亿参数模型发布，推动大模型开源和商用化。
- Meta推出CM3leon多模态文本和图像生成模型，支持文本生成图像、文本引导图像编辑等。
- Jasper AI因市场挑战裁员，麦肯锡与Cohere合作进军人工智能领域。

## 3. 关键事实与数据
- LLAMA2的上下文数量增加了一倍，达到4096个标记，预训练碳足迹估算显示碳排放量。
- Baichuan-13B在Baichuan-7B的基础上进一步扩大参数量到130亿，训练数据量超过LLaMA-13B 40%。
- Meta与Cohere合作，旨在将麦肯锡的行业专业知识与Cohere的自然语言处理技术相结合。

## 4. 深度分析正文


AI及信息技术应用2023年7月23日简报
=====================


本周的LLAMA2的发布、百川130亿参数模型开源是大事件，与闭源的chat服务不同，LLAMA2除了发布了foundation model，还做了Chat任务微调，并且公布可其论文、训练方法和关键调优的方法，从项目介绍来看，reward模型、微调的高质量语料对模型效果影响特别大，因此想做好，真得沉下信赖做好任务微调语料，根据业务场景和能力需要设计好的reward模型。

1，AI应用

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

\[摘要\]Meta 发布了 Llama 2——他们意外开源的大型语言模型的开源继承者（Llama 1 在今年年初泄露，并成为许多开源项目的基础）。新模型的训练数据比 Llama 1 多 40%，上下文数量增加了一倍，达到 4096 个标记。Llama 2 还可免费用于研究和商业用途。就性能而言，Llama 2 并不是现有的最佳模型，但由于它是开源的，它可能会很快得到改进。Meta 详细介绍了 Llama 2-Chat 的微调和安全改进方法，使社区可以在其工作基础上继续发展，为大语言模型的负责任发展做出贡献。执行了更稳健的数据清理，更新了混合数据，训练 token 总数增加了 40%，上下文长度翻倍。在训练硬件方面，Meta 在其研究超级集群（Research Super Cluster, RSC）以及内部生产集群上对模型进行了预训练。两个集群均使用了 NVIDIA A100。在预训练的碳足迹方面，Meta 根据以往的研究方法，利用 GPU 设备的功耗估算和碳效率，计算了 Llama 2 模型预训练所产生的碳排放量。

Stability AI刚刚基于 #Llama2  + #Orca递进式学习 推出了两个开源的模型

\[摘要\]Freewilly 1：在Llama65B模型上进行了微调，Freewilly 2：在Llama-v2 70B模型上进行了微调，尽管它们相对较小，但在多个基准测试任务中超过了ChatGPT，尤其是推理方面！这个模型训练是Stability AI和Carperai Lab的最新开创性LLM！

Google Bard 发布了大量更新，支持中文了  

\[摘要\]谷歌对Bard进行了大量更新，增加了对40多种语言的支持，包括中文，还加入了Google智能镜头、文字转语音功能。现在可以固定对话和分享对话内容。新增了5个选项来修改Bard的回答，使回答更加简单、详尽、简短、专业或随意。更新后，Bard的功能更强大，与CPT-3.5相当。

Meta 推出 CM3leon 多模态文本和图象生成模型

\[摘要\]CM3leon是多模态模型，通过从文本生成图像、文本引导图像编辑和其他任务，实现对图像的生成和编辑。它具有强大的功能和通用性。

Jasper AI因市场挑战而裁员

\[摘要\]人工智能内容平台初创公司 Jasper AI 于 9 个月前在 A 轮融资中筹集了 1.25 亿美元，首席执行官戴夫·罗根莫瑟 (Dave Rogenmoser) 表示，该公司已解雇了数量不详的员工。这是在生成人工智能市场竞争激烈和网站流量下降的情况下发生的。事实证明，并非所有 GPT 包装都是阳光和彩虹。

麦肯锡与 Cohere 合作进军人工智能领域

\[摘要\]麦肯锡（McKinsey）是一家全球领先的管理咨询公司，而 Cohere 是一家专注于开发自然语言处理技术的初创公司。近日，麦肯锡宣布与 Cohere 合作，共同进军人工智能领域。此次合作的目标是将麦肯锡的行业专业知识与 Cohere 的自然语言处理技术相结合，开发出具有高度智能化和个性化的解决方案。通过利用人工智能技术，麦肯锡希望能够更好地帮助客户解决复杂的业务问题，并提供更准确的决策支持。Cohere 的自然语言处理技术致力于理解和处理自然语言，从而使机器能够与人类进行交流。他们的技术不仅可以应用于语音识别和机器翻译等领域，还可以用于构建智能客服系统和自动化大规模文档处理等任务。据麦肯锡的发言人介绍，这次合作将为麦肯锡带来更高效和智能化的服务能力，为客户提供更准确、实时的洞察和建议。 

MetaGPT ：多代理元编程框架：给定一行需求，返回 PRD、Design、Tasks、Repo

\[摘要\]在给定一行需求后，MetaGPT可以根据需求中的关键词和信息来分析并生成相应的PRD。Design（设计）是根据需求文档和用户需求进行产品设计的过程。MetaGPT可以根据需求文档中的功能和交互需求，结合设计原则和最佳实践，生成相应的设计文档或设计草图。Tasks（任务）是将设计文档或需求分解为具体的开发任务的过程。MetaGPT可以根据需求和设计文档中的要求和细节，生成相应的任务列表或分解后的子任务。Repo（代码仓库）是开发团队使用的版本控制仓库，用于存放项目的源代码、文档等。MetaGPT可以根据项目的需求和开发任务，生成相应的代码仓库结构和相关文档的组织方式。

Baichuan-13B 是由百川智能开发的包含 130 亿参数的开源可商用的大规模语言模型

\[摘要\]Baichuan-13B 是由百川智能开发的包含 130 亿参数的开源可商用的大规模语言模型，在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。Baichuan-13B 有更大尺寸、更多数据：Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿，并且在高质量的语料上训练了 1.4 万亿 tokens，超过 LLaMA-13B 40%，是当前开源 13B 尺寸下训练数据量最多的模型。支持中英双语，使用 ALiBi 位置编码，上下文窗口长度为 4096。同时开源预训练和对齐模型：预训练模型是适用开发者的『 基座 』，而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型（Baichuan-13B-Chat），具有很强的对话能力，开箱即用，几行代码即可简单的部署。

谷歌的“创世纪”AI可以写新闻文章

\[摘要\]谷歌正在积极与新闻机构会面，推销一款代号为“Genesis”的人工智能工具，该工具可以撰写新闻文章。该工具已向多家出版物推荐，包括《纽约时报》、《华盛顿邮报》和《华尔街日报》的所有者，一些高管认为这“令人不安”，并对人工智能产生不准确的新闻报道表示担忧，谷歌澄清称，人工智能工具并不是要取代记者，而是充当副驾驶。

ChatGPT 的巨大更新允许“自定义指令”

\[摘要\]OpenAI 发布了“自定义指令”，这是对 ChatGPT 的重大更新。通过设置模型在所有对话中记住的指令，您可以更好地控制响应。允许您插入两个最多 1500 个字符的提示，以便 ChatGPT在对话中记住测试版适用于 Plus 用户（除英国和欧盟外的所有地区），免费用户“即将推出”要启用，请单击 ChatGPT 历史记录下的三个点 → 设置和测试版 → 测试版功能 → 自定义说明除了自定义指令外，OpenAI 还将 GPT-4 的消息上限从每 3 小时 25 条增加到 50 条。

BeatandRaise：ChatGPT 结合 SEC 文件和收益报告的数据

\[摘要\]按照您的想法研究金融市场。BeatandRaise是一个结合了SEC文件和收益报告的数据的平台。SEC文件是美国证券交易委员会要求上市公司提交的文件，包括年度报告、季度报告、公开招股说明书等。收益报告是上市公司公布的财务报表，包括利润表、资产负债表和现金流量表等。通过整合SEC文件和收益报告的数据，BeatandRaise提供了一个全面的公司数据分析平台。该平台可以帮助用户深入了解上市公司的财务状况、经营业绩和未来展望。

Cerebras 和阿联酋 G42：斥资 9 亿美元购买九台人工智能超级计算机

\[摘要\]Cerebras Systems 将在美国为阿联酋的 G42 安装九台人工智能超级计算机，第一台已安装在科洛沃市的圣克拉拉数据中心。该计划包括 576 个 CS-2 系统，其中包含世界上最大的芯片 Wafer Scale Engine 2，旨在实现 36 exaflops 的性能。Condor Galaxy 1 系统的初始阶段具有 2700 万个 AI 计算核心和 2 exaflops 的性能，现已上线，规模很快就会扩大一倍。

对话 HiDream.ai 梅涛：做一家对标 MJ 和 SD 的公司，比扎堆做 LLM 机会更大

\[摘要\]该工具在内部被称为“Genesis”，向《泰晤士报》、《华盛顿邮报》和新闻集团等主要媒体的高管展示；谷歌将该工具定位为“负责任”的技术，可以作为记者的私人助理，自动执行某些任务以释放他们的时间。

大模型幻觉问题调研-LLM Hallucination Survey

\[摘要\]大语言模型（LLM）在大量文本数据上训练，可以生成文本、翻译语言、编写不同类型的创意内容，并以信息丰富的方式回答你的问题。但LLM也容易产生幻觉，即生成与提示无关或不准确的文本。本调查研究了LLM幻觉的不同类型和成因，提出了一些方法来检测和缓解LLM幻觉。

Meta 发布了 LLAMA 2 系列大语言模型，还有一个针对对话场景微调的 LLAMA 2-CHAT 模型

\[摘要\]在报告中，Meta AI 着重强调了 LLAMA 2 在安全性和可靠性方面的突破，接近 GPT 等非开源模型的表现，让 LLAMA 2 成为更实用的开源模型。

未来的开始：Soundmatch

\[摘要\]对视频、粗剪或最终编辑有想法，但不确定配乐？Soundmatch 可让您从这个想法到为您的项目找到完美的配乐，这一切只需几秒钟的时间。告别浏览完美配乐。只需播放您的视频即可立即获得匹配的音乐推荐。通过 Soundmatch 拥抱 AI 的力量。Soundmatch 识别视频中的镜头包含的内容并生成用于语义搜索的相关关键字。接下来，它利用包含 Epidemic Sound 音乐的 YouTube 视频每日观看次数超过 20 亿次的数据，深入了解这些关键词通常如何大规模使用。然后，Soundmatch 可以轻松准确地为您提供完美适合每个视觉场景的推荐曲目列表。

马斯克高调官宣AI公司，华人成创始团队主力：吴宇怀、Jimmy Ba、杨格、张国栋、戴子航加盟

\[摘要\]今年 4 月，马斯克将推特并入了其成立的「X Corp.」，表达出了他想要打造万能应用程序的愿景。此次，xAI 在命名上有异曲同工之处，但独立于 X Corp 运作，并将与推特、特斯拉等其他公司紧密合作。这家公司，显然就是之前马斯克一直宣称的，OpenAI 的对手。

京东推出言犀大模型，预计8月正式上线

\[摘要\]7月13日上午，京东在2023京东全球科技探索者大会暨京东云峰会上正式推出京东言犀大模型，同时发布言犀AI开发计算平台。该平台已经启动预约注册，预计8月正式上线。京东集团CEO许冉表示，大模型在京东内部已经取得明确的实践效果。此外，京东对大模型也制定了“三步走”的明确规划，分别是在内部打造通用大模型、在内部的产业场景大规模实践，大模型的价值在内部充分验证后，再开放给合作伙伴。

携程集团发布首个旅游行业垂直大模型“携程问道”

\[摘要\]7 月 17 日，携程集团发布首个旅游行业垂直大模型“携程问道”。据介绍，在大模型的基础上，“携程问道”筛选高质量非结构性旅游数据 200 亿，结合携程现有精确的实时数据进行了自研垂直模型的训练。此前报道，携程梁建章：AI 具有不可预测和不可解释性，在经济上和人类互补。

CarynAI 是由网络红人 Caryn Marjorie 所创立的一款语音聊天机器人  

\[摘要\]生成式人工智能伙伴的新兴模式以及人们对创造伙伴的需求。文章提到了一个名为CarynAI的语音聊天机器人，由网络红人Caryn Marjorie创建，并通过每分钟1美元的费用与用户进行对话。该产品在上线一周内就赚取了72000美元，展示了人们与AI建立真实关系的案例之一。生成式AI伙伴已成为生成式人工智能的主要应用之一，成千上万甚至上百万人已与聊天机器人建立并维持关系。

2，产品市场创新

微软将向每个用户每月收取 30 美元的费用，让企业帐户在其基于云的生产力软件中访问其人工智能助手 Copilot

\[摘要\]Copilot 由 GPT-4 提供支持，允许用户通过在 Teams、Word、Excel、PowerPoint 和 Outlook 等应用程序中输入文本提示来生成内容。此次定价意味着数亿员工使用的企业级版本 Microsoft 365 的平均每月成本增加了 53% 至 83% 。微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 为这一定价进行了辩护，强调了人工智能在自动化日常工作和提高生产力方面的价值。

Coverquick人工智能工作申请助手

\[摘要\]由 CoverQuick 撰写的完美定制的简历和求职信给雇主留下深刻印象。Coverquick是一款人工智能工作申请助手，旨在帮助求职者更好地编写求职信和简历，并提供个性化的建议和优化，以提高求职者的成功率。Coverquick通过深度学习和自然语言处理技术，能够理解并分析求职者的个人信息、经历和技能，并根据这些信息为求职者生成高质量的求职信和简历。求职者只需输入自己的个人信息和求职意向，Coverquick便能根据用户的需求和行业惯例，自动生成与职位要求相匹配的求职信和简历。此外，Coverquick还具备自动校对和优化功能，能够检查文档中的语法错误和拼写错误，并提供改进建议。它还能根据行业标准和雇主的偏好，对文档中的格式、排版和字体进行优化，以确保求职信和简历的专业性和吸引力。Coverquick不仅是一个求职信和简历生成工具，还是一个智能求职顾问。它能够根据用户的背景和求职目标，提供个性化的职业建议和指导。例如，根据用户的教育和工作经验，Coverquick可以推荐适合的职位和行业，并提供相关的学习资源和培训计划。此外，它还能分析用户在求职过程中遇到的困难和挑战，并提供针对性的解决方案和策略。

Jinnee ：您的金融科技私人助理

\[摘要\]Jinnee是一个金融科技私人助理，为用户提供个性化的金融服务和支持。它结合了人工智能和金融知识，可以帮助用户管理财务、理财规划和投资决策。为您提供个性化帮助、银行服务、即时客户查询响应和全天候支持。

GitHub Copilot 注入 AI 聊天

\[摘要\]全球最受欢迎的人工智能编码助手 GitHub Copilot 宣布，其新的 Copilot Chat 功能现已作为有限的公开测试版提供给企业公司和组织。它与 ChatGPT 类似，旨在提高开发人员的工作效率。

埃隆·马斯克表示，Twitter 正在重新推出其长篇内容功能，现在称为“文章”

\[摘要\]根据埃隆·马斯克的表示，Twitter计划重新推出一项名为“文章”的长篇内容功能。这一功能旨在允许用户发布更长、更详细的内容，以便更好地表达其观点和想法。这个功能的重新推出可能是Twitter对用户需求的回应，许多用户希望能够在Twitter上分享更多深度的内容，而不仅仅限于短文。这也可能是Twitter进一步扩大其平台功能，吸引更多用户和内容创作者的努力的一部分。总的来说，这一举措显示了Twitter对用户反馈的关注，并努力推出新功能来满足用户可能的需要。

Google已发布了两个免费的文档和excel的AIS  

\[摘要\]描述您想要的内容以及创建文本或电子表格。单击魔杖并描述要生成的文本。例如：“关于法国美食中最好的食谱的书的摘要。您也可以使用相同的AI编辑现有文本。您可以在一键单击中缩短，延长，重新词等：整理文本信息成为表格。这是激活和使用这些免费功能的。


---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20230723-ai2023723](https://www.haxitag.com/briefs/ai-brief-20230723-ai2023723)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。