玩转AI大模型个人主页

@2401_85375298

玩转AI大模型

2024-07-23 14:05:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

爆火 | API终将淘汰，MCP+Milvus+LLM才是Agent开发新范式

大模型很聪明，但又貌似什么问题都解决不了。这应该是不少用户使用大模型过程中都会面临的问题。比如，问deepseek，即将到来的清明节有什么习俗，AI可以引经据典的给出答案；但如果要它给出一份三天两晚的清明旅行规划，给出的答案，就好像总是差点意思。原因很简单，在做旅行规划的时候，大模型缺乏必要的天气、机票、铁路、导航、酒店等必要数据与工具的接入。就像一个顶级聪明的大脑，但没有配备外部的“数据”输入，

#milvus #网络 #数据库 +3

ComfyUI：融合LLM技术，打造图片工作流新体验，实现图文音视一体化处理！（graphRAG、ollama助力）

我们正在使用一些Agent平台如FastGPT和Dify，他们注重于快速生成文本内容，知识库问答，提供自定义能力和与现有系统的集成性。同时，在AI绘画方面，我们原来使用SD，后来使用ComfyUI。虽然ComfyUI被广泛用于将文本转化为图像（文生图），但它实际上是一种生成式AI内容（AIGC）的工具，其功能不仅限于此。它还能够处理文本生成（文生文），因此可以实现多种内容的生成。Dify中也有提供

#百度 #microsoft #数据库 +1

RAG实战5-自定义prompt

在RAG实战4中我们分析了LlamaIndex中RAG的执行过程，同时留下了一个尚待解决的问题：LlamaIndex中提供的prompt template都是英文的，该如何使用中文的prompt template呢？

#人工智能 #语言模型 #机器学习 +1

Ai MCP + ELK 系统日志，排错提效 100%！

自从 Ai MCP 模型上下文协议，2024年11月，推出开放标准以后。2025年，就进入了全面的 MCP 服务落地。也正因如此，程序员👨🏻‍💻的学习就又多了一项新的应用技能，同时也成了面试热门问题。解封下码农的双手🙌🏻！在互联网程，序员工程开发方面，关于 Ai 提效最为常见的，也是市面上使用最多的，就是各类的 Ai 编码软件。如 cursor、trae.ai、IntelliJ IDEA

#人工智能 #elk #系统架构 +2

ACL 2024中RAG论文整理和简析

随着ACL 2024大会的圆满落幕，本文将重点介绍会议中涉及的与Retrieval-Augmented Generation（RAG）相关的论文，探索这一领域最新的研究成果和发展趋势。

#数据库 #elasticsearch #搜索引擎 +3

大模型长文本所面临的主要问题

对于长文本的处理，有时并不是希望生成完整的长文本，而是对长文本进行摘要、关键词提取、情感分析等任务。大模型在这种任务中同样面临文本长度的挑战。

#人工智能 #大数据 #算法 +3

GPU虚拟化到池化技术深度分析 2024_nvidia 计算卡资源池化

随着大模型的兴起，对GPU算力的需求越来越多，而当前现实情况使企业往往受限于有限的GPU卡资源，即便进行了虚拟化，往往也难以充分使用GPU卡资源或持续使用资源。为解决GPU算力资源不均衡等问题，同时支持GPU算力的国产化替代，提升GPU资源的利用率，GPU算力池化需求迫在眉睫。智能化应用数量的增长对GPU算力资源的需求越来越多。NVIDIA虽然提供了GPU虚拟化和多GPU实例切分方案等，依然无法满

#人工智能 #数据库 #算法 +4

使用大模型进行自动量化交易，从专家决策中学习经验，累计收益47.98%

利用强化学习（RL）开发有效的量化交易策略是一项具有挑战性的任务，因为与实时金融市场的在线互动存在高风险。因此，利用历史市场数据而无需额外探索的离线强化学习变得至关重要。然而，现有的离线RL方法常常难以捕获复杂的时间依赖项。金融时间序列固有的风险，可能与历史模式过拟合。为了解决这些挑战，我们引入了一个用预训练的GPT-2权重初始化并使用LoRA进行优化的DecisionTransformer （D

#学习 #AIGC #jenkins +3

基于LLM的金融投资策略能否长期跑赢市场？

大语言模型（LLMs）在资产定价和股票交易中应用，但评估多在狭窄时间框架和有限股票范围内，可能夸大效果。本文提出FINSABER框架，评估更长时间和更大股票范围的时机策略。系统回测显示，LLM策略在更广泛的交叉验证和长期评估中效果显著下降。市场状态分析表明，LLM策略在牛市中过于保守，表现不及被动基准；在熊市中过于激进，导致重大损失。需开发能够优先考虑趋势检测和市场状态风险控制的LLM策略，而非单

#金融 #人工智能 #大数据 +3

一文读懂RAG（检索增强生成）

近阶段，笔者落地了一个蛮深刻的项目，该项目通过RAG技术成功解决了一些问题。因此计划通过两篇文章跟大家分享有关RAG结合ToB Agent应用的探索与实践。本篇文章，主要关于笔者对RAG（围绕Navie RAG）的些许理解。

#人工智能 #机器学习 #python +3

共 363 条

请选择