cappuccino — DeepSeek Agents | Neura Market
    Neura MarketNeura Market/DeepSeek
    ChatGPTChatGPTClaudeClaudeGeminiGeminiCursorCursorGrokGrokPerplexityPerplexityDeepSeekDeepSeek
    CoPilotCoPilotStable DiffusionStable DiffusionMidjourneyMidjourney
    View All Directories
    OverviewRulesPromptsMCPsAgentsBlogVideosGuidesCoursesCommunityTrendingGenerate
    DeepSeekAgentscappuccino
    Back to Agents
    cappuccino

    cappuccino

    GML-FMGroup February 21, 2025
    44 copies 0 downloads

    Cappuccino is an GUI Agent based on desktop screen. It is a Manus-like AI Agent that can be deployed locally.

    Agent Definition
    <div align="center">
    <h1><span style="font-size: 60px;">☕️</span> 卡布奇诺</h1>
    <p>一个解放你双手的本地自动化智能体 🤖</p>
    <p>放心将任务交予我,去静享一杯醇香的卡布奇诺 ☕️</p>
    <p>待你悠然归来,任务早已悄然完成 🍃</p>
    <p align="center"><a href="README_en.md">English</a></p>
    </div>
    
    ## 💡 概述
    
    **卡布奇诺**是一个能操控电脑帮你解决繁琐任务的 GUI Agent,只需一条简单的指令,AI 就能生成详细的任务规划并执行。与解析图片元素或使用浏览器接口的其他现有方案不同,**卡布奇诺**是基于桌面屏幕的纯视觉方案。
    
    你可以直接使用 API 调用模型快速上手,也可以接入 Telegram 使用手机操控。
    
    ## ✨ 特点
    
    - **本地部署:** 本项目完全开源,可自行部署到自己的服务器并设置安全措施,保护您的隐私。
    - **可拓展性:** 当前架构支持自定义添加更多的执行器以拓展 Agent 的能力。
    - **软件适配:** 开发者可根据自身所需软件微调模型,让 Agent 获得更好的软件操控能力。
    
    ## 📰 更新
    
    - **[2026/02/24]** 🔧 添加 MCP 模块,现已支持接入 MCP 提升 Agent 能力。
    - **[2026/02/01]** 🏆 更新了系统架构、server,提供 Telegram 接入方式,暂不兼容客户端使用方式。
    - **[2025/03/26]** ⌨️ 添加了代码执行器,能更好的生成文件。
    - **[2025/02/27]** 🏆 现在你可以使用 qwen 和 gpt-4o 体验 cappuccino。
    
    > 你的 star🌟 是我们更新的最大动力!
    
    ## 🎥 演示
    
    https://github.com/user-attachments/assets/5949cd2f-92f1-4e2a-a1da-831cb7e08607
    
    ## 👨‍💻 快速开始
    
    ### 0. 硬件准备
    
    目前该项目支持部署在 Windows 和 Mac,由于系统的快捷键和操作方式等差异,不同系统的体验可能会有区别,我们后续还会进行更多的系统适配。
    
    ### 1. 模型部署
    
    本项目支持使用供应商的 API 或本地部署 LLM。若您需要本地部署,请使用 OpenAI 兼容的 API 服务,我们推荐使用 vLLM 进行部署,具体可以参考 [官网教程](https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html#openai-compatible-api-service) 。
    
    ### 2. 服务端配置与启动
    
    以下操作在需要被控制的计算机上执行。
    
    #### 2.1 克隆仓库
    
    ```bash
    git clone https://github.com/GML-FMGroup/cappuccino.git
    cd cappuccino
    ```
    
    #### 2.2 安装依赖
    
    首先安装 uv(如果已安装可跳过):
    
    ```bash
    # macOS/Linux
    curl -LsSf https://astral.sh/uv/install.sh | sh
    
    # Windows
    powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
    
    # 或使用 pip
    pip install uv
    ```
    
    然后安装项目依赖:
    
    ```bash
    uv sync
    ```
    #### 2.3 调整配置
    
    ```bash
    cp env.example .env
    ```
    
    填写对应的模型配置,可按需调整 Agent 配置、服务启动类型
    
    对于 Telegram 设置,请参考 TELEGRAM_SETUP.md 文档说明
    
    #### 2.3 启动服务
    
    ```bash
    uv run python run_server.py
    ```
    
    ### 3. 发送指令
    
    #### 方法 1:Python 脚本
    
    运行 request_demo 文件
    
    ```bash
    uv run python request_demo.py
    ```
    
    注:在另一台设备上运行以发起网络请求。当然,你也可以在被控制的终端上运行,但我们建议使用另一台设备发送指令,以避免影响计算机的操作执行。
    
    #### 方法 2:Telegram
    
    详情请参考 TELEGRAM_SETUP.md 文档说明
    
    ### ⚠️ 注意事项
    
    - 选择模型时,请确保名称正确且供应商支持该模

    Tags

    agentaibrowser-usecomputerusedeepseekllmomniparseropenclawopenmanus

    Comments

    More Agents

    View all
    hybrid-model-workflow

    hybrid-model-workflow

    HAL 分层混合模型工作流 — 强模型(Claude)负责理解/拆解/验收,低成本模型(DeepSeek)负责检索/提取/清洗。Hermes Agent skill。

    P
    ph4ble
    1
    Dynamic-Review-Agent

    Dynamic-Review-Agent

    An LLM agent fine-tuned on DeepSeek for spaced repetition, dynamically integrating knowledge points based on the Ebbinghaus forgetting curve.

    1
    1838177
    1
    StellarOS-Watch

    StellarOS-Watch

    基于 STM32F103 构建的端到端 AI 智能手表生态。自研“零重定位”原生机器码动态加载引擎与页面栈式 UI 框架;集成生产级 OTA 回滚保护机制与高带宽(921600 baud)串口协议栈。通过 Node.js 中继实现 DeepSeek AI 语义控制及 ASRPRO 语音全双工交互,是一个集成了分布式计算、现代存储管理与 AI Agent 的嵌入式全栈工程。

    C
    chenshuang888
    1
    UAVagent1.0deepseek

    UAVagent1.0

    A Meta-Agent-Driven Self-Evolving Multi-Agent System for UAV Detection and Tracking

    S
    StarlitPupils
    2
    hermes-goai-agent

    hermes-go

    One command to run Hermes AI Agent with a browser UI. Zero prerequisites. 一行命令,AI 就位。

    L
    LAI-755
    1
    Agent

    Agent

    网页应用Agent,接入DeepSeek、Mimo等模型

    C
    Cosmos-815
    1

    Stay up to date

    Get the latest DeepSeek prompts, rules, and resources delivered to your inbox weekly.

    Neura Market LogoNeura Market

    Discover the best AI prompts, plugins, and resources for DeepSeek and more.

    Content Types

    • Rules
    • Prompts
    • MCPs
    • Agents
    • Guides

    Platforms

    • ChatGPT Directory
    • Claude Directory
    • Gemini Directory
    • Cursor Directory
    • Grok Directory
    • Perplexity Directory
    • DeepSeek Directory
    • CoPilot Directory
    • Stable Diffusion Directory
    • Midjourney Directory
    • All Directories

    Resources

    • Blog
    • Documentation
    • Help Center
    • Marketplace

    Legal

    • Privacy Policy
    • Terms of Service

    © 2026 Neura Market. All rights reserved.

    |

    Not affiliated with any AI platform vendors.