< 微观察|微软CEO:AI Agent将取代SaaSCES 2025 NVIDIA 个人AI超算_案例中心_华体育app官网登录|华体会手机版
2025-03-20 案例中心

  随着AI Agent逐步融入软件服务生态和改造升级其能力,数据库将在3个方面加速进化:

  AI工作流适配:集成非结构化数据处理与全面的数据治理能力,如文本、音视频文件的存储、检索与分析,完整的数据清洗、标签、特征提取、质量监控等功能,为AI工作流提供高质量AI-ready数据基础。

  实时性与高并发解决能力增强:相较于当前遵循固定逻辑的软件应用,AI Agent 动态生成的交互请求在数量上激增且具有更高的随机性,要求数据库逐步提升实时处理和高并发能力,以满足 AI Agent 的海量随机数据交互需求。

  安全性升级:AI Agent引入数据留痕、模型窃取等特有风险,加之复杂系统带来攻击面扩大和响应处理困难,使得数据库面临更高安全挑战,需从多维度升级系统安全性。

  宣布在 AWS 和 Azure 上为 Databricks 无服务器和 Mosaic AI 模型服务工作负载提供出口控制的公共预览版本,可以直接在Unity Catalog中定义,允许集中管理跨多个产品和工作区的出站访问,帮助降低没有经过授权或意外数据传输的风险,同时能减少潜在的额外网络成本。具体工作细节:

  配置细粒度出口策略:用户可通过账户控制台创建或更新网络策略对象,定义工作负载的宏观出口状态和受限访问时可访问的FQDN和云存储资源列表。

  集中管理出口态势:每个用户有default-policy对象定义默认网络策略,可更新该对象或创建额外网络策略对象覆盖默认策略,实现不同环境策略的集中管理。

  审计调试违反相关规定的行为:策略建立连接时强制执行,拒绝事件记录在system.access架构内的outbound_network系统表中。

  支持强制模式与试运行模式,可在正式实施前测试策略并避免对现有生产环境造成影响。此外,通过限制数据仅传输至授权目的地,该机制也有助于减少潜在的额外网络成本,并满足高合规行业对于数据安全和治理的要求。(src: 宣布推出针对无服务器和模型服务工作负载的出口控制)

  在 Databricks Runtime 16.1 公共预览版中提供了对排序规则的支持,让数据库可根据不同语言和上下文正确地进行文本比较和排序。

  多语言支持:该功能允许为超过 100 种语言选择相应的排序规则,确保能够按照用户的期望处理文本,如在德语中正确排序带分音符的字符,或将法语中的“ç”视为“c”等.

  丰富的比较功能:可执行诸如不区分大小写的比较来查找英文名称、非英文字母排序以及不区分重音的搜索等任务,简化了多语言文本数据集的排序、搜索和合并操作。

  性能提升:与传统方法相比,使用排序规则执行不区分大小写的结果查询时,查询执行速度可提高22倍,大幅度的提高了数据处理的效率。

  与Spark和SQL的深度集成:排序规则与超过100个Spark和SQL表达式兼容,能够与连接、排序、聚合、聚类等各种数据操作无缝配合,大多数字符串表达式都支持排序规则,如CONTAINS、STARTSWITH、REPLACE、TRIM等。

  后续版本将支持在更细粒度的层面(如目录、架构或表)设置排序规则,并添加对 RTRIM 的更广泛支持。(src: Introducing Collations to Databricks)

  BCG与QED Investor联合发布《2024年全球金融科技报告》。重点摘录如下:

  由于全球仍有数十亿人没有银行账户或未充分享受银行服务,以及GenAI带来的效率提升,金融科技行业仍有巨大发展的潜在能力。预计到2030年,全球金融科技市场规模将从目前的3200亿美元增至1.5万亿美元

  挑战者银行是利用金融科技提供创新金融服务的新型银行,专注于传统银行服务不足的细分市场,通过高度数字化和个性化服务吸引客户。它们主要是通过互联网和移动应用提供服务,无需线下网点。例如,英国的Monzo和Starling Bank,美国的Chime和Varo,这些银行通过提供电子信用卡、数字储蓄账户、在线贷款等服务,以及个性化的金融工具,如消费预算和行为分析,来提升客户体验。

  嵌入式金融:将金融服务整合到非金融平台中,使用户在使用非金融应用时能无缝获得金融服务,如支付、借贷、保险等,提升使用者真实的体验和企业收入。如支付宝和微信支付。

  估计到2030年嵌入式金融市场营收规模将超过3200亿美元,其中面向消费者1200亿美元、面向中小企业1500亿美元、面向大企业500亿美元。

  互联商务:银行开展广告业务。利用其海量的客户的真实需求和行为数据,通过数据分析和挖掘,为客户提供个性化的购物推荐和优惠信息。银行可以也建立自己的商务平台,整合各类商家的产品和服务,为客户提供一站式的购物体验。例如,摩根大通的Chase Media Solutions、第一资本的Capital One Shopping及花旗银行的Citi Shop。

  开放银行:一种金融服务模式,利用开放API等技术方法,允许银行和别的金融机构共享客户数据和金融服务。目前全球有超过65个国家在某些特定的程度上实施了开放银行,预计这趋势将持续。

  给银行业的影响:影响不大,不太可能改变银行业的基本竞争格局,在开放银行已发展十几年的国家并未出现“杀手级应用场景,用户渗透率不高。

  给广告业影响:预计在传统的银行应用场景之外,开发交易层面的数据访问将对广告和互联商务产生更广泛的影响。

  主要场景:客户支持、监管申报、数字营销、软件的编程、测试和建档。(src:)

  中央机关集采数据库,发布《2024 年度事务型数据库软件框架协议联合征集采购项目》征集公告。

  采购中心:中央国家机关政府采购中心、北京市公共资源交易中心、广东省政府采购中心、安徽省政府采购中心、云南省政府采购和出让中心、吉林省公共资源交易中心(吉林省政府采购中心)

  共11家响应人参与响应,全部响应人通过初审。阿里云、优炫、万里数据库、虚谷伟业、海量数据、南大通用、东方国信、腾讯云中标,瀚高、神舟通用、金仓被淘汰。

  国家发展改革委、国家数据局、工业与信息化部联合印发《国家数据基础设施建设指引》。

  《指引》提出,国家数据基础设施将总体实现“汇通海量数据、惠及千行百业、慧见数字未来”的美好愿景。具体推进路径分为

  为2024-2026年,重点完成三项工作,一是开展数据基础设施技术路线试点试验;二是制定统一目录标识、统一身份登记、统一接口要求的标准规范;三是完成国家数据基础设施建设顶层设计,明确国家数据基础设施建设的技术路线和实践路径。

  为2027-2028年,将基本形成跨层级、跨地域、跨系统、跨部门、跨业务的规模化数据可信流通利用格局,实现全国大中型城市基本覆盖。

  到2029年,基本建成国家数据基础设施整体的结构,初步形成国家数据基础设施基本格局,构建数据流通利用体系,形成产业生态,建设和运营体制机制基本建立。

  。打造低成本、高效率、可信赖的流通环境,实现数据在不同组织、行业之间安全有序流动,面向典型场景创新融合数据应用。

  。显著提升数据交换性能,降低数据传输成本,为数据大规模共享流通提供高质量通道。

  。构建标准化、多层次、全方位的安全防护框架,系统保障数据基础设施相关的网络、算力、数据、应用安全。

  《指引》针对国家数据基础设施在数据流通利用、算力、网络、安全等方面,部署了具体建设任务。

  方面,分别建设数据流通利用设施底座、数据高效供给体系、数据可信流通体系、数据便捷交付体系等。

  方面,将重点推进算力资源科学布局;东中西部算力协同;算力与数据、算法创新融合;算力发展与安全保障协同。

  方面,分别面向国家数据基础设施安全保障和数据流通利用安全保障,提出了方向指引。(src:,)

  美联储理事会成员 Lisa D. Cook 做了有关2024年美国“经济和金融稳定性评估”的演讲。具体包含以下方面:

  :美国经济在2024年表现强劲,GDP在第三季度年化增长3.1%,第四季度预计会增长2.5%。劳动力供应的增加(包括25至54岁劳动参与率的恢复和移民的增加)以及劳动生产率的提升(疫情后年均增长1.8%)是主要推动力。此外,家庭支出的强劲表现得益于工资增长。

  :通胀水平显著下降,2024年11月核心PCE通胀率为2.8%,较2022年6月的7.2%峰值大幅回落。尽管租金和住房服务通胀仍然较高,但其增速已放缓,预计2025年将进一步改善。核心商品的价值下降和工资增速放缓对通胀的回落起到及其重要的作用,但未来通胀路径可能仍然不平稳。

  :劳动力市场总体稳定,但逐渐降温。11月失业率为4.2%,较2023年4月的3.4%有所上升,同时职位空缺与失业人数比已从2022年的2.0降至1.1。自愿离职率和跳槽工资溢价下降,表明劳动力市场趋于平衡,不再对通胀形成显著压力。

  :美联储在2024年自9月起累计降息100个基点,当前利率政策的限制性有所减弱。未来货币政策将更为谨慎,进一步降息的时机和幅度将依据通胀和劳动力市场数据。政策目标仍是通过稳定价格和维持最大就业来实现最佳经济结果。

  :美联储着重关注私人信贷、稳定币、网络安全和生成式AI的潜在金融风险。私人信贷的迅速增加可能带来杠杆风险,稳定币缺乏全面监管易导致挤兑风险,网络攻击对金融系统依赖性较强的机构构成威胁,而AI在金融中的集中化应用可能引发系统性风险。对这些新兴领域的监测和风险管理将成为未来的重点工作方向。(src:)

  微软CEO Satya Nadella 预测:AI Agent 将替代所有的SaaS,软件开发迎来新方向。

  观点:SaaS应用程序本质上只是数据库之上的一层薄薄的用户界面和业务逻辑。

  新软件模式:今后的软件将会由底层数据库和直接与数据库交互的智能代理组成,不再需要传统的硬编码业务逻辑。所有的业务逻辑都会转移到智能代理身上,AI Agent按照每个用户的需求自动达成目标,如生成按收入排名的前五大客户图表,即使像Excel这样的工具,也可能因AI的发展而变得不再必要。

  部分软件转型:成为 AI Agent 的代理,AI Agent成为核心层,调用各类工具。如Excel和Word可以被视为Copilot的代理。

  数据库选型:未来的后端数据库并不重要,Agent并不针对特定类型的数据库。关键是要构建一个与代理配合最有效、最便宜、最适合特定用例的数据库。(src:)

  CES 2025于1月7日至10日重返拉斯维加斯,参展单位数量超越4500 家,这中间还包括约1400家初创公司,还有1100位演讲者将在300多场会议中发言。参会者将见证从AI和数字健康,到先进移动出行、智能社区、可持续发展和无障碍技术等领域的最新发展。

  【CES 2025】NVIDIA发布了一系列基于全新Blackwell架构的产品,展现了其在图形处理和AI领域的最新进展。

  包括RTX 5070、RTX 5070 Ti、RTX 5080和旗舰级的RTX 5090。这些显卡采用Blackwell架构。

  :Blackwell架构集成920亿个晶体管,AI算力达到4000 TOPS,光线 TFLOPS,着色器性能为125 TFLOPS,显存带宽为1.8 TB/s。

  :新一代深度学习超级采样(DLSS 4)引入多帧生成技术,通过人工智能预测并生成多个未来帧,提升渲染效率,实现高达8倍的性能提升。

  :RTX 5070定价549美元,RTX 5070 Ti为749美元,RTX 5080为999美元,RTX 5090为1999美元。这些显卡将于1月下旬至2月初上市。

  这是全球最小的个人AI超级计算机,搭载全新的GB10超级芯片,基于Grace Blackwell架构。

  :在FP4精度下,GB10芯片提供高达1千万亿次浮点运算的AI性能,支持运行多达2000亿参数的AI模型。

  :配备128GB统一内存和最高4TB的NVMe存储,使用标准电源即可运行。

  旨在让AI理解物理世界的因果关系、空间结构和力学原理。该模型的特点包括:

  :分为Nano、Super和Ultra三个版本,参数规模从40亿到140亿不等,适用于不同应用场景。

  :以开放模型许可的方式发布,开发者可通过NVIDIA API目录或Hugging Face下载模型,进行微调和部署。

  【CES 2025】AMD发布了一系列新产品,涵盖台式机处理器、笔记本电脑处理器、图形处理单元(GPU)以及专为游戏掌机设计的处理器,展现了其在高性能计算和AI领域的最新进展。

  AMD推出了旗舰级台式机处理器锐龙9 9950X3D和锐龙9 9900X3D,均基于Zen 5架构,采用第二代AMD 3D V-Cache技术。

  :拥有16核心32线MB三级缓存和64MB 3D V-Cache缓存),TDP为170W。

  :具备12核心24线W。根据AMD官方数据,锐龙9 9950X3D在1080P高画质下的游戏性能相比前代锐龙9 7950X3D平均提升约8%,相比竞争对象酷睿Ultra 9 285K则有约20%的优势。

  AMD发布了全新的锐龙AI MAX系列移动处理器,旨在为笔记本电脑提供更强大的AI和图形性能。

  :配备16个Zen 5核心,最高加速频率5.1GHz,80MB缓存,集成50 TOPS算力的XDNA2架构NPU,以及40单元的RDNA 3.5架构核显,显存带宽达256GB/s。官方多个方面数据显示,锐龙AI MAX+ 395在多项渲染测试中相比竞争对象酷睿Ultra 9 288V平均有2.6倍的速度优势,在图形性能测试中也有约1.4倍的领先。

  RDNA 4架构 包括Radeon RX 9070 XT和Radeon RX 9070。采用台积电4纳米制程,内置第二代AI加速器、第三代光线追踪加速器和第二代AMD Radiance Display引擎。

  :全新的FidelityFX Super Resolution 4基于机器学习,专为RDNA 4打造,支持更高质量的4K游戏画面和更高性能的帧生成,以及通过第二代游戏延迟技术Anti-LAG 2实现更低的延迟。

  【CES 2025】Intel 发布了第二代酷睿Ultra处理器系列。新增支持:英特尔Wi-Fi 7(5 Gig);Thunderbolt 5 & 5;英特尔连接性能套件(利用AI优化网络连接);高保真、低功耗的英特尔蓝牙低功耗音频等技术。

  :针对创作者和游戏玩家,200HX系列拥有多达24个核心(8个性能核和16个能效核),集成NPU(神经网络处理单元),多线程性能相比上一代提升了41%。200H系列配备多达8个英特尔Xe核心的锐炫显卡,并集成英特尔矩阵引擎,游戏性能较上一代提升了22%。

  :面向主流移动用户,配备多达2个性能核和8个能效核,集成英特尔Xe LPG架构显卡,具备最高可达24 TOPS的AI算力。

  :用于台式机,新增了12款65W和35W产品,最多可搭载8个性能核和16个能效核,适用于游戏、专业创作和日常办公等多种应用场景。

  恩智浦半导体(NXP Semiconductors)于1月7日宣布,将以6.25亿美元现金收购奥地利汽车软件开发商TTTech Auto,以强化其汽车业务,特别是软硬件ECO。 恩智浦是全球领先的汽车芯片制造商,而TTTech Auto总部在维也纳,专注于开发安全关键型中间件软件,促进汽车硬件平台、操作系统和应用程序的集成,并确保在推出重大软件更新时关键功能不受影响。 恩智浦汽车嵌入式系统总经理延斯·辛里希森表示,此次收购将恩智浦的汽车硬件产品组合与全球领先的安全软件解决方案提供商相结合,旨在满足汽车制造商对软硬件集成的需求。 交易完成后,TTTech Auto的管理层和约1100名员工将并入恩智浦的汽车部门。 (src:

  SK集团会长崔泰源近日在2025年国际消费电子展(CES 2025)上表示,SK海力士的高带宽内存(HBM)开发速度已超越英伟达的要求,暗示双方合作将进一步深化。崔泰源透露,SK海力士正向英伟达独家供应HBM产品。 此前,英伟达CEO黄仁勋曾要求SK海力士将下一代HBM4芯片的供货时间提前六个月,以满足市场对AI芯片日渐增长的需求。 SK海力士在HBM领域的领头羊,使其在与英伟达的合作中占据优势。 随着人工智能技术的加快速度进行发展,双方计划在更广泛的领域展开合作,包括将AI应用于物理领域。 (src: )

  人工智能初创公司Anthropic正进行新一轮融资,计划筹集20亿美元,估值将达到600亿美元,较一年前的估值增长逾三倍。 本轮融资由Lightspeed Venture Partners领投。 此前,亚马逊于2024年11月追加了40亿美元投资,使其对Anthropic的总投资额达到80亿美元,成为该公司的最大投资者。 Anthropic由前OpenAI研究高管创立,致力于开发以安全为核心的人工智能技术,其基本的产品是AI聊天机器人Claude。 此次融资将使Anthropic跻身美国估值最高的初创公司之列,仅次于SpaceX、OpenAI、Stripe和Databricks。 (src:

  苹果加快扩展新闻平台。苹果公司正加速推展其Apple News新闻应用程式的计划。英国《金融时报》引述知情人士称,苹果计划将Apple News推广至更多国家,并拟在英国开设本地新闻报道。Apple News覆盖美国、加拿大、英国和澳洲约1.25亿用户。苹果希望透过规模扩张及提升广告效益,进一步强化其作为出版业关键收入来源的角色。(src:

  美国候任总统唐纳德·特朗普于1月7日宣布,阿联酋亿万富翁侯赛因·萨吉瓦尼(Hussain Sajwani)计划投资200亿美元,在美国建设大型数据中心。这项投资将支持在美国中西部、南部和西南部的“阳光地带”建设新的数据中心,旨在维持美国在技术领域的领头羊。 特朗普表示,人工智能的发展在很大程度上依赖于数据中心的支持,未来几年这一领域将变得很热门。 侯赛因·萨吉瓦尼是迪拜房地产研发企业达马克(DAMAC Properties)的董事长,该企业具有中东地区唯一的特朗普品牌高尔夫球场。 他表示,计划投资200亿美元,甚至更多,具体取决于市场机会。(src:

  腾讯微信被移除美国贸易恶名市场名单。美国贸易代表办公室(USTR)发布所谓《2024年假冒和盗版恶名市场清单》。美方称,该清单旨在曝光据称助长大规模盗版及商标假冒行为的线上和实体市场行为体。腾讯微信曾在2022年和2023年两次被列入名单,但今年被移除。腾讯曾强烈反对被列入该名单,并向美国贸易代表办公室强调,腾讯长期以来在知识产权方面投入巨大,并且在全世界内开展合作以推动知识产权保护。然而,包括淘宝、拼多多、百度网盘等在内的多个中国网络站点平台仍在此次名单中,抖音商城则首次被列入。(src:

  美股大盘:本周股市收盘下跌。市场利率上升是本周股市走势的一大驱动因素,反映出市场对通胀持续上升以及美联储可能长期维持高利率的担忧。本周10年期国债收益率飙升18个基点至4.78%,2年期国债收益率较上周五上涨12个基点至4.40%。这一价格趋势是对本周经济数据发布的回应(

  12月份ADP就业变化报告低于预期(122,000;共识131,000)。

  每周初申请失业金人数意外下降(201,000;共识218,000;前值211,000)。

  12月份就业报告数据显示非农就业人数增加 25.6万人,失业率从4.2%降至 4.1%。1月份密歇根大学消费者信心指数初值显示,未来一年和长期通胀预期也显著上升。

  12月17-18 日FOMC会议纪要,该纪要与美联储主席鲍威尔在会后新闻发布会上的讲话相呼应。纪要传达出这样一种信号:美联储应该推迟再次降息,直到它对通胀回归2%目标更有信心和/或对劳动力市场以更明显的方式恶化更加担忧。

  美国国债本周收跌,受强劲的12月就业报告影响(新增就业25.6万,高于预期的15.4万和前值的21.2万),降息预期降温。短期债券在开盘小幅下跌后,因就业数据意外加速且失业率降至4.1%(前值4.2%),抛售压力加剧。2年期债券收益率突破200日均线月底以来新低,长期债券收益率则降至2023年11月以来最低

  芝加哥商品交易所FedWatch工具显示,5月降息可能性从55.3%降至38.0%,6月降息概率为56.3%。美联储理事鲍曼表示12月降息是“调整阶段的最后一次”,美国银行也预计FOMC不会进一步放松政策。本周,2年期美债表现优于其他期限,2年期-10年期利差扩大6个基点至38个基点。原油突破200日均线月以来高点;美元指数涨0.4%至109.65,周涨0.7%。

  LG电子披露的初步核实多个方面数据显示,按合并财务报表口径计算的公司2024年全年盈利同比减少6.1%,为3.4304万亿韩元(约26.4亿美元)。销售额同比增长6.7%,为87.7442万亿韩元(约675亿美元)。

  三星电子发布的未经审计的初步业绩显示,第四季度盈利同比增长130.5%,达到6.5万亿韩元(约50亿美元),但仍远低于市场预期。与第三季度的9.18万亿韩元(约70.6亿美元)相比,三星电子第四季度盈利下降了29.19%。

  增长10.7%,达到75万亿韩元(约577亿美元)。2024年全年盈利为32.72万亿韩元(约252亿美元),同比增长398.2%。

  。Chroma 通过使知识 (knowledge) 、事实 (facts) 和技能 (skills) 可插拔,从而简化了 LLM 应用程序的构建。它以高效存储、高性能检索和灵活集成为目标,为开发者提供处理高维向量数据的解决方案。该项目由位于旧金山的 Chroma 公司于 2022 年 5 月开展,github star数17k。

  :Jeff Huber:Chroma 的联合发起人兼 CEO。他是一名连续创业者,入选福布斯30 Under 30精英榜,他的上一家公司获得了YC投资,做的是低成本的假肢制造。Anton Troynikov:Chroma 的联合发起人。他也是连续创业者,曾经担任过 Nuro 和 Meta 的计算机视觉工程师。

  采用高维向量索引技术(如 HNSW 和 Annoy)支持数百万条数据的高效检索。

  支持版本控制和元数据管理,确保数据可追溯性。同时,提供增量更新、自动备份和分布式存储能力。

  通过分布式架构提供高可靠性,支持数据副本存储和容灾机制。可在大规模集群环境下高效运行,满足企业级需求。

  :自然语言处理:Chroma 可存储并检索经过嵌入模型(如 Sentence-BERT)处理的文本向量,用于问答系统、文本匹配、智能搜索引擎等场景。推荐系统:通过存储用户行为数据的嵌入向量,Chroma 可提供实时个性化推荐。图像检索:结合图像嵌入模型(如 CLIP),Chroma 可实现基于图像特征的相似图像检索。智能客服:Chroma 支持多模态数据整合,可以在文本和语音数据之间高效检索。(src:,,)

  :OpenHands是一款 AI 编程工具,支持多智能体协作提高开发效率,减少开发者的编码工作量。OpenHands 基于编写代码、与命令行交互和浏览网页等方式实现与环境的互动。该项目由位于美国波士顿的 ALL Hand AI 公司于 2024 年 3 月开展,github star数43k,并有超过150名贡献者。

  :Robert Brennan:ALL Hand 的联合发起人兼 CEO。他曾在Google从事自然语言处理和搜索功能方面的 Senior Software Engineer,后在初创公司Rho AI(量化和预测气候技术、产品、服务和投资对环境影响)、初创公司Fairwinds(提供Kubernetes服务)工作。Graham Neubig:ALL Hand 的联合发起人兼首席科学家。他是卡内基梅隆大学语言技术研究所副教授,研究大多分布在在 ML 和自然语言处理(NLP)领域,特别是大语言模型的基础研究和应用,包括问答、代码生成、多语言处理和评估/可解释性等方面。Xingyao Wang:ALL Hand 的联合发起人兼首席 AI 官。他本科毕业后直博 UIUC,研究大多分布在在由基础模型驱动的交互式语言代理,攻读博士期间选择暂停学业创办 All Hands AI。

  :该代理几乎能够执行人类研发人员可以执行的任何操作,如修改代码、运行命令、浏览网页、调用API,甚至从StackOverflow复制代码片段。

  事件流架构:基于事件流管理代理与环境的交互,包括代理的动作和环境的观察结果。状态结构封装了代理执行所需的所有相关信息,如事件流、LLM调用成本等。

  运行时环境:Docker 沙箱:为每个任务会话启动一个安全隔离的 Docker 容器沙箱,所有动作都在沙箱中执行。动作执行 API:API服务器在 Docker 沙箱中运行,处理命令执行、Python 代码执行和网页浏览等动作。任意 Docker 镜像支持:支持代理在任意操作系统和软件环境中运行,基于任意 Docker 镜像的运行时实现。

  代理技能:Agentskils 库提供一些基本工具没办法实现的实用功能,如文件编辑、文档阅读等,方便社区贡献和代理使用。

  多代理委托:支持一个代理将特定子任务委托给另一个代理执行,实现多代理之间的协作。(src:,,,)

  CHASE: A Native Relational Database for Hybrid Queries on Structured and Unstructured Data

  Kai Zhang:复旦大学计算机学院副教授。主要研究方向包括面向大模型的检索生成增强、向量数据库;大规模推荐系统;基于GPU异构硬件的数据处理。Zhenying He:复旦大学计算机学院教授。主要研究方向是大数据管理与分析。他在哈尔滨工业大学获得学士、硕士和博士学位。

  随着数据分析和推荐系统的发展,对结构化和非结构化数据来进行混合查询已成为一种新的范式。现有的数据库系统通常将向量搜索作为关系查询引擎的插件来实现,试图利用近似最近邻搜索(ANN)索引来提升性能。然而,这种设计可能错失了一些潜在的优化机会,导致某些查询性能欠佳。

  ,这是一个原生设计用于支持结构化和图像非结构化数据高效混合查询的查询引擎。CHASE通过在查询处理的多个阶段进行特定设计和优化来实现这一目标,具体包括:

  语义分析:系统解析SQL查询,识别混合查询类型,并重写逻辑计划以减少计算开销。例如,引入映射操作符将ANN索引扫描得到的相似性分数映射到临时列,避免重复计算。

  优化KNN类查询:将排序操作符与窗口操作符分离,插入限制操作符,使扫描、排序和限制操作符组成一个单独的流水线,优化物理操作符的选择,利用ANN索引高效检索结果。

  优化类别驱动的VKNN-SF查询:引入updateState操作符动态跟踪查询执行状态,减少不必要的范围扩展和冗余计算。

  KNN类查询的映射操作符:修改索引扫描操作符的输出,返回计算的相似性分数,并传递给映射操作符,避免重复计算。

  DR-SF查询的索引扫描操作符:采用基于ANN的范围搜索算法,从查询向量的邻近节点开始扩展搜索,减少不必要的比较。

  类别驱动的VKNN-SF查询的updateState操作符:动态维护每个类别的状态信息,评估要不要扩展搜索范围,减少计算开销。

  :将SQL查询解析为高级MLIR模块,通过一系列优化传递将中间表示转换为低级LLVM IR,最终生成机器代码。CHASE扩展了LingoDB的方言和传递,引入新的操作符和优化技术,减少解释开销,提升查询性能。

  通过使用真实世界的数据集进行广泛的评估,根据结果得出CHASE与现有系统相比取得了显著的性能提升,速度提升从13%到7500倍不等。具体来说:对于top-k查询,CHASE实现了高达33%的性能提升;对于基于距离的范围查询,CHASE实现了24%到33%的性能提升;对于距离连接查询,CHASE大约实现了64%的性能提升;对于KNN连接查询,CHASE实现了7500倍的性能提升。(src:)

  LEAP: LLM-powered End-to-end Automatic Library for Processing Social Science Queries on Unstructured Data

  Chuxuan Hu:伊利诺伊大学厄巴纳-香槟分校(UIUC)大三学生。研究兴趣包括社会计算、网络分析、数据挖掘和机器学习。Austin Peters:芝加哥大学的教员和法学讲师。他的研究用AI、机器学习和其他数据科学工具来研究民事诉讼和法规解释中的各种主题。Daniel Kang:UIUC 计算机科学系和 ECE 的助理教授。研究重点是使科学家和分析师能够轻松使用机器学习进行分析。

  社会科学家越来越关注分析非结构化数据(例如推文)中的语义信息(例如情感),这一些信息在数据中并非原生存在。以成本效益高的方式执行此分析需要用机器学习(ML)模型来提取语义信息,然后分析结构化数据。然而,这一过程对领域专家来说仍具挑战性,大多数表现在:

  ML模型的选择与应用:要选择正确的ML函数并掌握其接口,同时确定适当的函数执行顺序。

  自然语言查询的转换:将自然语言问题转换为实际查询(如SQL、数据框库或统计库)困难重重,因为这涉及到复杂的分析操作,需要高级编程技能,且自然语言往往模糊不清。

  提出了LEAP,一个端到端的库,能够用ML回答社会科学的自然语言查询。其基本功能包括:过滤模糊查询:确保答案的确定性。选择ML函数:从内部支持和用户定义的ML函数中选择,将非结构化数据扩展为带有必要注释的结构化表格。生成和执行代码:响应自然语言查询。

  前向规划过滤器(Forward Planning Filter):识别模糊查询,终止库执行,并建议具体替代方案,成功率达到96%。

  阶段选择器(Stage Selector):自动选择表格生成、代码生成、代码执行和结果展示等阶段。

  表格生成(Table Generation):通过ML函数扩展当前表格,确保包含足够的信息来回答查询。

  代码生成(Code Generation):将自然语言查询转换为可执行代码。

  代码执行和结果展示(Code Execution and Result Display):执行生成的代码并展示结果。

  函数树(Function Tree):将函数列表组织成树结构,仅将目标叶节点的函数作为候选函数,减少了查询成本。

  双向链表(Doubly Linked Lists):连接具有相互依赖关系的函数,提高了查询的准确性。

  别名检查块(Alias Check Blocks):在执行每个函数之前检查是不是已存在匹配的列,避免重复执行ML函数,节省查询成本。

  通过率:在QUIET-ML的120个查询中,LEAP实现了100%的@3通过率和92%的@1通过率。

  成本效率:平均每个查询的成本为1.06美元,其中代码生成成本仅为0.02美元。与使用专业标注服务(如Scale)或雇佣研究助理(RAs)等传统社会科学研究方法相比,LEAP的成本不到传统方法的0.1%。(src:)

  End-To-End Causal Effect Estimation from Unstructured Natural Language Data (NeurIPS 2024)

  Nikita Dhawan:University of Toronto and Vector Institute的在读博士,曾在Meta和Google做实习Researcher,研究方向是ML和Healthcare

  Rahul G. Krishnan:现任University of Toronto 的 Assistant Professor,MIT的ML博士,曾在微软研究院担任高级研究员,研究方向是ML和Healthcare

  Chris Maddison:现任University of Toronto 的 Assistant Professor,牛津的statistics博士,曾在DeepMind担任高级研究科学家,研究统计机器学习的方法论。

  传统因果效应估计的局限:非结构化自然语言数据(如在线论坛、社会化媒体、临床报告等)中蕴含着丰富的因果信息,但传统因果效应估计方法依赖手动收集和结构化数据,成本高昂且耗时,限制了其应用范围。

  NATURAL 方法拓展自平均治疗效应(ATE)的经典估计方法(如逆倾向得分加权 IPW 和结果插补 OI),将其应用于非结构化自然语言数据领域。除传统因果推断假设(强可忽略性、正性假设)外,NATURAL 还额外引入自然语言报告数据假设(目标人群的数据生成与文本报告相关)和真实观测条件访问假设,确保从自然语言数据中合理估计因果效应。

  NATURAL Full:理论上的理想版本,基于报告的条件分布进行蒙特卡洛估计,这在某种程度上预示着需要对报告中

  进行概率估计,以计算因果效应。这种方法计算复杂度非常高,尤其对于高维协变量的数据,会导致计算量剧增。

  ,然后结合条件概率计算逆倾向得分加权估计值。例如,对于一份医疗报告,它会从报告中提取相关协变量信息,如患者的年龄、性别、症状等,再依据这一些信息计算该患者接受某种治疗的倾向得分,进而对因果效应进行加权估计。NATURAL OI:从报告中

  ,用于结果插补估计。比如在研究药物疗效时,从大量的患者报告中抽取所需信息,通过插补的方式估计出不同治疗方案下可能的结果,从而计算因果效应。

  ,不仅采样协变量和治疗变量,还可能涉及更多的变量,将非结构化文本信息转化为结构化表格数据集,以应用传统 ATE 估计方法。

  对大量的原始文本报告进行初步筛选,去除一些明显无信息或不相关的报告,缩小数据范围。

  判断报告的相关性,筛选出与研究主题相关的报告。例如,在研究某种药物的疗效时,LLM 能够准确的通过报告内容判断其是否涉及该药物的使用和相应的效果描述。

  从筛选后的报告中提取治疗和结果信息,将不包含治疗和结果信息的报告进一步排除。

  根据具体的研究纳入标准,对报告和协变量进行最终筛选,确保数据符合标准要求,具代表性和可靠性。

  条件概率提取与计算:LLM 从筛选报告提取已知(如患者基础信息)和未知(需文本分析挖掘)

  ,如从临床报告提取家族病史、生活小习惯等。推断给定报告和协变量下治疗和结果的条件概率分布。根据纳入标准计算报告权重,为 ATE 估计做准备。

  合成数据集结果:基于 Hillstrom 和 Retail Hero 合成数据集,NATURAL 方法性能好。随报告数量增加,

  NATURAL Full 估计的联合分布和倾向得分与真实分布的 KL 散度减小,ATE 的 均方根误差(RMSE) 降低,结果更可靠

  ;NATURAL IPW 的 RMSE 低至 0.15,而基线,体现 NATURAL 处理合成数据的高效性和准确性。

  真实数据集结果:在 Reddit 的四个真实数据集(糖尿病药物 Semaglutide、偏头痛治疗)上,NATURAL 估计器预测 ATE 与真实临床试验 ATE 方向一致,

  表明能有效提取真实世界非结构化文本数据中的因果信息,为实际应用提供有力支持。

  关键步骤影响:消融研究表明,纳入标准过滤和预训练 LLM 的插补对 NATURAL 性能关键;条件概率计算时,模型规模大、数据量多可提升性能;LLAMA2 估计的倾向得分比均匀分布更能平衡协变量,证明 NATURAL 方法的有效性。(src:)

  观察-大数据与智能产业链 | 识别-核心趋势与变量 | 实操-实盘投资组合,验证产品与技术的市场落地进展

CONTACT US
欢迎随时与我们联系