当前位置:首页>新闻 > 使用MongoDB构建AI:轻松应对从预测式AI到生成式AI

使用MongoDB构建AI:轻松应对从预测式AI到生成式AI

毫无疑问,如今从生成式AI (GenAI )中获益最大的是那些早已运用预测式AI (Predictive AI )的组织。2023年6月,麦肯锡在2023年6月发布的《生成式人工智能的经济潜力》研究中得出了与此相同的结论 (报告链接:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier )。

 

原因主要有以下几点:

1. 内部文化决定组织是否愿意尝试和探索人工智能

2. 组织是否具备相关技能,但必须强调的是相比预测式AI,生成式AI更依赖于开发者,而不是数据科学家

3. 组织是否拥有准确无误、精心挑选的数据,可随时输入到GenAI模型中

但这并不意味着只有具备预测式AI使用经验的团队才能从生成式AI中获益。如果分析研究MongoDB“构建AI案例研究系列” 中的实例,不难发现,许多处于不同AI成熟度阶段的组织都在利用MongoDB进行人工智能创新。

 

本文介绍两家企业,它们成功地构建了预测式AI应用程序,并朝着生成式AI的方向迈进:

1. MyGamePlan助力职业足球运动员和教练提升球队表现。

2. Ferret.ai利用公开数据进行背景调查,帮助企业和消费者之间建立信任。

在这两个案例中,预测式AI成为数据驱动型决策的核心。如今,这两家公司都正在探索生成式AI,希望通过推出新产品来扩展服务,以提高用户参与度。两者的共同之处是他们都选择了MongoDB Atlas,并将其灵活运用到各种AI用例中。

 

MyGamePlan: 利用AI驱动的洞察力提升职业足球运动员的表现

利用数据和分析来提升职业运动员表现的做法并不新鲜。但是,解决方案往往极其复杂,需要集成来自多个数据提供者的数据,导致成本高昂且洞察时间长。MyGamePlan专注于协助职业足球俱乐部和球员改变这种状况。

很多欧洲优秀的球队工作人员和球员都正在使用MyGamePlan,其中包括勒沃库森足球俱乐部 (Bayer Leverkusen,目前位列德国足球甲级联赛第一名 )、桑德兰足球俱乐部 (AFC Sunderland,英冠联赛 )、卡斯特利翁足球俱乐部 (CD Castellón,目前位列西班牙第三级别联赛第一名 )及弗罗茨瓦夫西里西亚足球俱乐部 (Slask Wroclaw,目前位列波兰足球甲级联赛第一名 )。

据MyGamePlan首席技术官兼联合创始人Dries Deprest介绍,MyGamePlan借助前沿分析、AI技术及用户友好型平台实现了赛事数据、球员跟踪数据和视频资源数据的无缝集成,并重新定义了足球分析的方式。平台可以实现工作流程自动化,帮助教练和球员制定比赛战术、促进球员发展并推动卓越战略实施,从而助力球队取得胜利。

MyGamePlay平台的核心是基于Python的自定义预测式AI模型。这些模型托管在Amazon Sagemaker上,能够分析比赛的特定时刻,对球员的个人表现及其对球队的贡献进行评分。此外,这些模型还可以推測球员的表现和贡献,并与对手球队的球员进行比较,以帮助制定比赛日战术。

 

数据是确保模型和预测准确性的关键。该公司将MongoDB Atlas作为其数据库,用于存储:

1. 每场比赛的元数据,包括比赛、球队和球员的数据。

2. 每场比赛的事件数据,如传球、断球、犯规和射门等。

3. 跟踪遥测数据,可每隔100毫秒捕捉每位球员在场的位置。

这些数据可从MongoDB迁移到Python DataFrames,与第三方数据流结合使用,共同训练公司的ML模型。同时,可从特定比赛序列中生成推论并将其存储回MongoDB Atlas,供教练和球员进行下游分析。

图1: 利用MyGamePlan网页和手机应用,教练和球员可以即时评估比赛并制定战术。

Deprest表示,MyGamePlan正在使用AI模型持续丰富数据,并将这些数据用于洞察和分析,因此MongoDB非常适合这一用例。

两年前,MyGamePlan启动了开发项目,从那时起便开始采用MongoDB。数据涉及复杂的多向关系,需要将比赛与球员、事件和跟踪相互关联。为了更好地表示这种数据关系,MyGamePlan选择在丰富的文档结构中使用嵌套元素。这种方法不仅能够提高开发者的工作效率,还能够提升程序运行效率。如果使用外键创建关系模型,再连接关系数据库中的规范化表格,这样极为缓慢且低效。

在开发方面,Deprest表示,使用PyMongo driver将MongoDB与托管在Sagemaker的Python ML数据管道和MongoDB Node.js driver集成在一起,随后将其用于基于React、面向客户端的网页和移动应用程序。

Deprest认为,造成MongoDB与NoSQL数据之间差异的两个关键因素在于: 首先,MongoDB更受开发者的青睐,采用率更高。这就意味着团队能够快速熟悉它,并利用它来提高效率。其次,用户可以直接在实时数据的基础上构建应用内部分析,无需花费时间和金钱将其移动到数据仓库或数据湖中。借助MongoDB的聚合管道,用户可以使用强大的滚动、变换和窗口函数来处理和分析数据,以根据需求对数据进行切片和切块。

除了预测式AI,MyGamePlan团队正在评估如何利用GenAI来进一步改善用户体验。

据Deprest介绍,MyGamePlan平台拥有丰富的数据和分析,希望让球员和教练能够更加轻松地从中获得洞见。为此,他们正在探索在数据之上进行自然语言处理,并通过聊天和问答界面来实现这一目标。借助GenAI,用户可以轻松地可视化并总结数据。目前,团队正在评估将OpenAI旗下大型语言模型 (LLM )ChatGPT与复杂的提示工程方法相结合,同时利用LangChain进行编排,配合使用LlamaIndex和MongoDB Atlas Vector Search来实现检索增强生成 (RAG )的能力。

基于MongoDB Atlas来构建应用,使MyGamePlan团队能够利用开发者数据平台的丰富功能,为未来的几乎所有应用和AI需求提供支持。用Deprest的话来说,就是:“由于MyGamePlan的源数据保存在MongoDB Atlas数据库中,将其与向量存储及就地向量搜索结合使用为我们的开发者提供了一种非常高效且完美的解决方案。”

 

Ferret.ai: 通过AI和MongoDB Atlas生成智能,解析关系以创建信任,同时降低成本达30%

无论在现实世界还是在数学世界,我们都在不断地与他人建立关系。不论是线上交易、厂商或专业人士与潜在客户,还是投资者与企业创始人或者其他方面,建立新的人际关系不可避免。在所有这些关系中,信任必不可少,然而建立信任却是一件非常具有挑战性的事情。Ferret.ai正是这样一款旨在帮助消除猜疑、建立信任的工具。

Ferret是一个AI平台,专注于为公司和个人提供实时、公正的情报,以识别风险并把握机遇。借助先进的预测式和生成式AI,结合成千上万的全球数据源及数十亿公开文件,Ferret.ai可提供精心策划的关系情报和监测服务 (这些服务以往仅限于金融行业使用 ),帮助树立透明度新标准。

Ferret首席技术官Al Basseri在谈及Ferret的工作原理时表示,Ferret.ai从公共来源中获取个人信息。这些来源包括社交网络、交易记录、法庭文件、新闻档案、公司所有权和注册商业利益等。相关数据通过Kafka管道传输到公司的Anyscale/Ray MLops平台,在这个平台上,再使用spaCy提取和机器学习模型来进行自然语言处理。Ferret.ai从数据源中获得的所有元数据 (接近30亿个文档 )及模型推断均存储在MongoDB Atlas中。用户可通过页面和移动客户应用程序,企业用户可通过即将推出API来使用Atlas中的数据。

图2: 人工智能+实时数据=来自Ferret.ai的关系智能

除了预测式AI之外,公司开发者目前正在尝试在Ferret平台上使用GenAI。Basseri表示,Ferret与英伟达的数据科学团队建立了紧密的合作关系,从而能够对所提供的数据来源和分析进行综合,以帮助客户更好地了解联系人,并建立良好的关系。实验表明,相比那些规模更大、更通用的大型语言模型,Mistral模型及其混合专家集成系统所需的资源开销更少。

除了托管来自Ferret的预测式和生成式AI模型数据外,客户数据和联系人列表也存储在MongoDB Atlas中。Ferret可对公共记录源进行持续监测和评分,及时检测个人身份信息的变化。

正如Basseri所介绍的,通过使用MongoDB Atlas Triggers,Ferret.ai可以监测评分的更新,并立即向消费应用程序发送警报,从而使客户能够实时了解关系网络动态。这是一种具有反应式的、完全基于事件驱动的程序,开发者只需进行设置即可轻松实现。

 

Basseri还介绍了MongoDB为其开发者带来的其它一些优势,其中包括:

借助Atlas,该服务以完全托管的形式提供,并融入了最佳实践。这使开发者和数据科学家可以从数据库运行工作中解脱出来,将精力投入到应用程序和AI创新上

MongoDB Atlas是一种成熟的解决方案,已被广泛应用于许多高增长的企业

随着团队的迅速扩展,拥有了解MongoDB的工程师变得至关重要

除了数据库之外,Ferret正将其对MongoDB Atlas平台的应用扩展到文本搜索领域。随着公司进入谷歌云,其正在从现有的Amazon OpenSearch服务迁移到Atlas Search

在谈及迁移的驱动因素时,Basseri表示:“将数据库和搜索统一在同一个API有助于减少开发者的认知负荷,从而提高他们的工作效率,加快新功能的构建。这样可以消除了数据库和搜索之间同步数据带来的不便,从而缩短了工程周期。此外,这也意味着用户可以获得更好的体验,因为之前的延迟瓶颈已经消失,用户在Ferret平台上搜索联系人和内容时,可以得到最新的结果,而不是过时的数据。从OpenSearch迁移到Atlas Search还可以节省资金成本,并获得更多的灵活性。通过消除数据库和搜索引擎之间不必要的数据冗余,可将每月的总云成本减少30%。由于Atlas是支持多云的开发者数据平台,因此可以根据需要在多个云提供商之间迁移。”

迁移完成后,Basseri及其团队将能够使用Atlas Vector Search进行开发,并继续构建Ferret平台的GenAI功能。

从以上两个案例可以看出,无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持。如需了解更多信息,欢迎关注MongoDB微信公众号“MongoDB数据库”。

为您推荐
  • 广西一新娘,因“长得太美”而火出圈,网友:山窝里的金凤凰!
    2024-03-15
    在广西某个幽静的村落,一场盛大的婚礼成为了村民们茶余饭后的热议焦点。婚礼之所以如此引人瞩目,不仅因为它洋溢着浪漫与温馨的气息,更因为新娘那令人惊艳的容貌,仿佛一位踏月而来的仙女,让在场的每一个人都为之倾倒。新娘名为小梅,是一位土生土长的广西姑娘。她那双清澈明亮的大眼睛,宛如山间的一泓清泉,灵动而深邃。她那弯弯的眉毛,如同柳叶一般婀娜多姿,映衬着白皙如玉的肌肤,更显清丽脱俗。当她笑起来时,那灿烂的笑
  • 接连签约!南通将新增一批打卡地
    2024-03-15
    为全面落实全市“重大项目攻坚突破年”部署要求,2024年开年以来,全市文广旅系统主动作为、强势开局,推动文旅市场加快复苏,重大文旅项目如“春花绽放”般签约。截至目前,新签约文旅项目7个,总投资额24亿元。项目详情滨海酒店项目签约时间:2024年1月签约地点:启东市投资金额:10亿元项目介绍:滨海高端度假酒店项目位于启东市江海澜湾旅游度假区,由上海长甲集团投资建设,总投资10亿元,占地约370亩,将打造集高端度假酒店
  • 四川五日游旅游路线,四川游哪些美食,来四川如何规划行程
    2024-03-15
    四川,简称"川"或"蜀",省会成都,位于中国大陆西南腹地,自古就有"天府之国"之美誉,是中国西部门户,大熊猫故乡。四川今与重庆、贵州、云南、西藏、青海、甘肃、陕西诸省市交界。四川东部为川东平行岭谷和川中丘陵,中部为成都平原,西部为川西高原。这次出游是朋友推荐的一位四川当地旅行规划师小雅安排的,没有任何自费项目!从接站到住宿、交通、吃饭、门票等都是小雅安排,十分省心。真心推荐
  • 夫妻关系如何维持?寻找专属于你的婚姻幸福之路
    2024-03-15
    在《社会心理学》中提到了两个在现代生活中似乎无可辩驳的事实,一是亲密而持久的婚姻关系是幸福生活的标志;二是亲密而持久的婚姻关系正在减少。由此,人们必须付出努力才能防止爱情的衰退,这就像哈维说的:“‘用心照顾’我们的亲密关系能够使我们获得更长久的满足”,那么怎样才算是对亲密关系的“用心照顾”,也就是说我们应该如何维持夫妻关系,对此,同样在《社会心理学》中给出了一些建议:这些建议虽然有效,但又太过笼统
  • “微笑型抑郁症”患者突然自杀,亲朋好友无比震惊!这类悲剧其实可以预防
    2024-03-15
    我们写过不少关于“微笑型抑郁症”的文章。比如去年7月,一代天后李玟自杀身亡,几乎震惊了所有人!在大众心目中,她一直阳光、热情、爱笑,网友完全没想到她会自杀。她的离世,令不少人开始了解“微笑型抑郁症”。
  • 吃“裸碳水”升糖快,不妨给它加层衣服
    2024-03-15
    你是否听说过“裸碳水”?它是由简单碳水化合物组成的食物,不含脂肪、蛋白或纤维,比如加工食品、糖果、白米饭及含糖汽水等。与全谷物豆类等复合碳水相比,它极易消化并导致血糖飙升,易导致肥胖、二型糖尿病或心脏病。Verywell网站发文称,目前有很多减肥策略要求低碳水,这会走入另一个极端。无论是裸碳水或是复合碳水,都会在体内转化成葡萄糖,这是大脑最青睐的热量来源,对大脑活动以及人体功能非常重要。来源 / unsplash不
  • 天津男篮主场胜四川 李荣培高难度跳投
    2024-03-15
    3月10日,天津先行者队球员李荣培(中)在比赛中投篮。新华社记者 赵子硕 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,天津先行者队主场113比93战胜四川金强队。3月10日,天津先行者队
  • 新疆男篮主场击败北控 阿不都沙拉木突破
    2024-03-15
    3月10日,新疆伊力特队球员阿不都沙拉木(中)在北京控股队球员刘晓宇(右)、陈国豪的夹击防守下突破上篮。新华社记者 胡虎虎 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,新疆伊力特
  • 辽宁本钢胜深圳马可波罗 韩德君篮下强吃
    2024-03-15
    3月12日,辽宁本钢队球员韩德君(左二)在比赛中上篮。新华社记者 潘昱龙 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第42轮比赛中,辽宁本钢队主场109比98战胜深圳马可波罗队。3月12日,深圳马可波罗队球员萨林杰(左)在比赛中拼抢篮板球。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(中)在比赛中上篮。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(左上)在比赛中投篮。新华社记者 潘昱龙 摄3
  • 《谢谢你温暖我》央八首播,流水账记事,故事性差,李兰迪演技好
    2024-03-15
    3月9日,电视剧《谢谢你温暖我》在央八单集首播,在腾讯视频5集更新。基于目前已经上线的剧情内容来讲,这部电视剧在叙事上,过分流水账了,显然不足以用故事性吸引观众。在演技方面,李兰迪确实是该剧的加分项。收视率方面,后续来讲,该剧成绩应该不会好。这部电视剧的剧情梗概已经提前把主线故事亮明了,男女主角谈恋爱之后,男主角生病了,女主角不离不弃照顾男主。这当然是一个很有价值的主线,男女朋友之间,夫妻之间,相濡