
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本篇分享通俗易懂的讲述了GRPO核心原理(不涉及大量公式),并通过TRL库和自定义奖励函数编写代码实现GRPO的完整训练流程!使Qwen2.5-0.5B-Instruct模型具备数学推理的能力~

开源项目Suna凭借更强功能、隐私安全和免费离线部署吊打Manus。本文介绍了最强通用智能体Suna的核心架构机器完整的部署流程,每个使用电脑的你都能免费部署自己的AI通用智能体,解放双手不再是梦~

DeepSeek, Qwen的大火,是否激发你动手玩大模型的DNA,本分享教你使用Ollama在本地管理使用大模型,并搭配page assit快速搭建Web服务访问大模型,动手操作起来吧!

本篇分享我们使用Qwen-Agent的MCP和WebUI功能开发了用户友好的智能体应用。得益于Qwen3模型的强大能力和Qwen-Agent工具接入MCP的便捷性,我们可以10分钟打造自己的Manus

介绍了MCP的两种通信方式:标准输入输出和基于HTTP的服务器推送事件。通过开发一个天气助手智能体的实战案例,生动展示了两种模式的异同, 还安利了MCP Inspector服务端调试工具,大家来看看吧

本文介绍了使用unsloth微调DeepSeek大模型的方法,无需编程即可将通用模型转化为领域专家。涵盖微调原理(如LORA高效调参)、环境搭建、数据集构建、参数设置及实战步骤,并演示了模型评测对比。

DeepSeek, Qwen的大火,是否激发你动手玩大模型的DNA,本分享教你使用Ollama在本地管理使用大模型,并搭配page assit快速搭建Web服务访问大模型,动手操作起来吧!

本文对MCP的标准化、与function calling相比优势进行深入分析,同时通过Python代码实践开发了MCP客户端和服务端代码,帮大家掌握MCP全貌,快速拥抱MCP这项大模型的革命性技术~

全网最详细新版DeepSeek-R1核心功能测评,包含官方和用户团体的报告以及笔者实际评测案例,证实DeepSeek-R1-0528在编程能力、Function Calling能力、文本能力极大提升!

这篇文档教你如何用OpenAI格式调用DeepSeek大模型API,打造多轮对话机器人。从API优势到代码示例,手把手带你玩转AI,让你从“AI小白”变身“AI大神”。快来看看吧~
