logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

爆火 | API终将淘汰,MCP+Milvus+LLM才是Agent开发新范式

大模型很聪明,但又貌似什么问题都解决不了。这应该是不少用户使用大模型过程中都会面临的问题。比如,问deepseek,即将到来的清明节有什么习俗,AI可以引经据典的给出答案;但如果要它给出一份三天两晚的清明旅行规划,给出的答案,就好像总是差点意思。原因很简单,在做旅行规划的时候,大模型缺乏必要的天气、机票、铁路、导航、酒店等必要数据与工具的接入。就像一个顶级聪明的大脑,但没有配备外部的“数据”输入,

文章图片
#milvus#网络#数据库 +3
ComfyUI:融合LLM技术,打造图片工作流新体验,实现图文音视一体化处理!(graphRAG、ollama助力)

我们正在使用一些Agent平台如FastGPT和Dify,他们注重于快速生成文本内容,知识库问答,提供自定义能力和与现有系统的集成性。同时,在AI绘画方面,我们原来使用SD,后来使用ComfyUI。虽然ComfyUI被广泛用于将文本转化为图像(文生图),但它实际上是一种生成式AI内容(AIGC)的工具,其功能不仅限于此。它还能够处理文本生成(文生文),因此可以实现多种内容的生成。Dify中也有提供

文章图片
#百度#microsoft#数据库 +1
RAG实战5-自定义prompt

在RAG实战4中我们分析了LlamaIndex中RAG的执行过程,同时留下了一个尚待解决的问题:LlamaIndex中提供的prompt template都是英文的,该如何使用中文的prompt template呢?

文章图片
#人工智能#语言模型#机器学习 +1
Ai MCP + ELK 系统日志,排错提效 100%!

自从 Ai MCP 模型上下文协议,2024年11月,推出开放标准以后。2025年,就进入了全面的 MCP 服务落地。也正因如此,程序员👨🏻‍💻的学习就又多了一项新的应用技能,同时也成了面试热门问题。解封下码农的双手🙌🏻!在互联网程,序员工程开发方面,关于 Ai 提效最为常见的,也是市面上使用最多的,就是各类的 Ai 编码软件。如 cursor、trae.ai、IntelliJ IDEA

#人工智能#elk#系统架构 +2
ACL 2024中RAG论文整理和简析

随着ACL 2024大会的圆满落幕,本文将重点介绍会议中涉及的与Retrieval-Augmented Generation(RAG)相关的论文,探索这一领域最新的研究成果和发展趋势。

文章图片
#数据库#elasticsearch#搜索引擎 +3
大模型长文本所面临的主要问题

对于长文本的处理,有时并不是希望生成完整的长文本,而是对长文本进行摘要、关键词提取、情感分析等任务。大模型在这种任务中同样面临文本长度的挑战。

文章图片
#人工智能#大数据#算法 +3
GPU虚拟化到池化技术深度分析 2024_nvidia 计算卡资源池化

随着大模型的兴起,对GPU算力的需求越来越多,而当前现实情况使企业往往受限于有限的GPU卡资源,即便进行了虚拟化,往往也难以充分使用GPU卡资源或持续使用资源。为解决GPU算力资源不均衡等问题,同时支持GPU算力的国产化替代,提升GPU资源的利用率,GPU算力池化需求迫在眉睫。智能化应用数量的增长对GPU算力资源的需求越来越多。NVIDIA虽然提供了GPU虚拟化和多GPU实例切分方案等,依然无法满

文章图片
#人工智能#数据库#算法 +4
使用大模型进行自动量化交易,从专家决策中学习经验,累计收益47.98%

利用强化学习(RL)开发有效的量化交易策略是一项具有挑战性的任务,因为与实时金融市场的在线互动存在高风险。因此,利用历史市场数据而无需额外探索的离线强化学习变得至关重要。然而,现有的离线RL方法常常难以捕获复杂的时间依赖项。金融时间序列固有的风险,可能与历史模式过拟合。为了解决这些挑战,我们引入了一个用预训练的GPT-2权重初始化并使用LoRA进行优化的DecisionTransformer (D

文章图片
#学习#AIGC#jenkins +3
基于LLM的金融投资策略能否长期跑赢市场?

大语言模型(LLMs)在资产定价和股票交易中应用,但评估多在狭窄时间框架和有限股票范围内,可能夸大效果。本文提出FINSABER框架,评估更长时间和更大股票范围的时机策略。系统回测显示,LLM策略在更广泛的交叉验证和长期评估中效果显著下降。市场状态分析表明,LLM策略在牛市中过于保守,表现不及被动基准;在熊市中过于激进,导致重大损失。需开发能够优先考虑趋势检测和市场状态风险控制的LLM策略,而非单

文章图片
#金融#人工智能#大数据 +3
一文读懂RAG(检索增强生成)

近阶段,笔者落地了一个蛮深刻的项目,该项目通过RAG技术成功解决了一些问题。因此计划通过两篇文章跟大家分享有关RAG结合ToB Agent应用的探索与实践。本篇文章,主要关于笔者对RAG(围绕Navie RAG)的些许理解。

文章图片
#人工智能#机器学习#python +3
    共 363 条
  • 1
  • 2
  • 3
  • 37
  • 请选择