
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大模型很聪明,但又貌似什么问题都解决不了。这应该是不少用户使用大模型过程中都会面临的问题。比如,问deepseek,即将到来的清明节有什么习俗,AI可以引经据典的给出答案;但如果要它给出一份三天两晚的清明旅行规划,给出的答案,就好像总是差点意思。原因很简单,在做旅行规划的时候,大模型缺乏必要的天气、机票、铁路、导航、酒店等必要数据与工具的接入。就像一个顶级聪明的大脑,但没有配备外部的“数据”输入,

我们正在使用一些Agent平台如FastGPT和Dify,他们注重于快速生成文本内容,知识库问答,提供自定义能力和与现有系统的集成性。同时,在AI绘画方面,我们原来使用SD,后来使用ComfyUI。虽然ComfyUI被广泛用于将文本转化为图像(文生图),但它实际上是一种生成式AI内容(AIGC)的工具,其功能不仅限于此。它还能够处理文本生成(文生文),因此可以实现多种内容的生成。Dify中也有提供

在RAG实战4中我们分析了LlamaIndex中RAG的执行过程,同时留下了一个尚待解决的问题:LlamaIndex中提供的prompt template都是英文的,该如何使用中文的prompt template呢?

自从 Ai MCP 模型上下文协议,2024年11月,推出开放标准以后。2025年,就进入了全面的 MCP 服务落地。也正因如此,程序员👨🏻💻的学习就又多了一项新的应用技能,同时也成了面试热门问题。解封下码农的双手🙌🏻!在互联网程,序员工程开发方面,关于 Ai 提效最为常见的,也是市面上使用最多的,就是各类的 Ai 编码软件。如 cursor、trae.ai、IntelliJ IDEA
随着ACL 2024大会的圆满落幕,本文将重点介绍会议中涉及的与Retrieval-Augmented Generation(RAG)相关的论文,探索这一领域最新的研究成果和发展趋势。

对于长文本的处理,有时并不是希望生成完整的长文本,而是对长文本进行摘要、关键词提取、情感分析等任务。大模型在这种任务中同样面临文本长度的挑战。

随着大模型的兴起,对GPU算力的需求越来越多,而当前现实情况使企业往往受限于有限的GPU卡资源,即便进行了虚拟化,往往也难以充分使用GPU卡资源或持续使用资源。为解决GPU算力资源不均衡等问题,同时支持GPU算力的国产化替代,提升GPU资源的利用率,GPU算力池化需求迫在眉睫。智能化应用数量的增长对GPU算力资源的需求越来越多。NVIDIA虽然提供了GPU虚拟化和多GPU实例切分方案等,依然无法满

利用强化学习(RL)开发有效的量化交易策略是一项具有挑战性的任务,因为与实时金融市场的在线互动存在高风险。因此,利用历史市场数据而无需额外探索的离线强化学习变得至关重要。然而,现有的离线RL方法常常难以捕获复杂的时间依赖项。金融时间序列固有的风险,可能与历史模式过拟合。为了解决这些挑战,我们引入了一个用预训练的GPT-2权重初始化并使用LoRA进行优化的DecisionTransformer (D

大语言模型(LLMs)在资产定价和股票交易中应用,但评估多在狭窄时间框架和有限股票范围内,可能夸大效果。本文提出FINSABER框架,评估更长时间和更大股票范围的时机策略。系统回测显示,LLM策略在更广泛的交叉验证和长期评估中效果显著下降。市场状态分析表明,LLM策略在牛市中过于保守,表现不及被动基准;在熊市中过于激进,导致重大损失。需开发能够优先考虑趋势检测和市场状态风险控制的LLM策略,而非单

近阶段,笔者落地了一个蛮深刻的项目,该项目通过RAG技术成功解决了一些问题。因此计划通过两篇文章跟大家分享有关RAG结合ToB Agent应用的探索与实践。本篇文章,主要关于笔者对RAG(围绕Navie RAG)的些许理解。
