首页
学习
活动
专区
圈层
工具
发布

#token

SkillOpt 让你的 Skill 实现自进化

七牛开发者

上周,在介绍 bugfix 小工具 Superlog,热心群友 Frank 提到了一个小工具 SkillOpt,表示它能把 Skill 当作模型来训练,基于方法...

000

好消息,Agnes 推出免费 LLM Token,不用买 Coding Plan 啦!

小傅哥

两周还没到,买的一堆 coding plan、token plan 也都吸干净了。 好在发现了 Agnes AI,它把核心全模态模型 API 免费开放!编码、画...

800

资源点直接通兑 Token,一个套餐覆盖云资源与 AI 调用

腾讯云开发TCB

Tencent Technology (Shenzhen) Company Limited | 云开发(TCB)团队 (已认证)

*Token换算说明:按 DeepSeek-V4-Flash 直供模型、80% 输入命中上下文缓存估算(缓存命中 20 点/百万 tokens,未命中 1000...

1900

谷歌最新大模型 DiffusionGemma 续集:Unsloth 把它压到 18GB,单卡飙到 2000+ Token/s

Ai学习的老章

这是我觉得 DiffusionGemma 这次最值得玩的东西——加一个 --diffusion-visual 参数,可以亲眼看到 256 个 token 怎么从...

800

谷歌最新26B大模型,打字机变印刷机,推理速度1000+Token,4090可跑

Ai学习的老章

DiffusionGemma 是谷歌 DeepMind 基于 Gemma 4 架构打造的 26B 参数大模型,但它和我们熟悉的 ChatGPT、Qwen、Dee...

1000

Token 节省 60% 到 95% 零侵入的压缩利器

勇哥AI笔记

在这篇文章讲了针对工具调用的压缩工具 content-mode:这个开源工具把 token 消耗节省了98%,

3200

音频信号的Token化方案:如何让声音进入大模型?

gavin1024

音频信号的Token化是多模态大模型处理声音信息的基础环节。本文将介绍音频Token化的基本原理、主要技术路线,分析音频采样参数对模型理解效果的影响,以及VIT...

4010

从Harness架构到Token经济学的探索

腾讯云开发者

Transformer 的自注意力机制中,每个 token 在处理时需要与序列中所有之前的 token 计算注意力。对于序列中第 i 个 token,注意力计算...

3410

一文搞懂Token经济学:同样额度多干3倍活,只需理解消耗机制

腾讯云开发者

Token 是模型处理文本的最小单元。不同模型的 tokenizer 略有差异,以 Claude / GPT 系列为例的粗略换算:

3100

别再给AI送钱:10款开源工具省80%Claude Code Token,大项目直接砍49倍

用户11563501

再介绍一个项目Local LLM Proxy,可以利用他们贡献出来,存下来下个月使用,我为人人,人人为我,都不再为token使用太多触发限额发愁,也不再为这几天...

3710

用Claude Code啃大代码库太费token?这个开源工具砍了92%工具调用

用户11563501

用 Claude Code 处理大项目的开发者,大多碰过同款问题:代码库规模一上来,每次让AI探索结构都要等很久,文件扫个没完,工具调用堆成山,token哗哗消...

2600

灰色中转站喷涌背后,Token运营的四种方向

用户11563501

Claude API的九折代理,GitHub、淘宝、Telegram上都有。200美元的Max订阅拆成几十份,每份20-30美元。货源不外乎几种:批量薅免费试用...

5000

8行代码让Claude Code闭嘴:输出token直降63%,废话全砍

用户11563501

Claude Code每次回复你,先要说一句「Sure!」「Great question!」,结尾再来句「I hope this helps!」,中间还要复述一...

2200

Context Mode:为你的AI开发工具节省98%的上下文token

用户11563501

该项目灵感来自Cloudflare的Code Mode,后者将工具定义从数百万token压缩到约1000个。Context Mode则解决了另一个方向的问题——...

2900

Claude Sonnet 4.6发布:百万token上下文与人类级计算机操作能力,性能逼近Opus

用户11563501

Claude Sonnet 4.6今天正式上线,这是Anthropic迄今为止最强大的Sonnet模型。该模型在编码、计算机使用、长上下文推理等核心能力上实现全...

4910

ISON:比JSON节省70% token的数据格式,专为LLM设计

用户11563501

在AI应用开发中,JSON格式的数据传输消耗了大量token。开发者Mahesh Vaikri提出了一种名为ISON(Interchange Simple Ob...

3100

给外行解释Token在Transformer中的旅程

用户11563501

分词(Tokenization):原始文本被切分成标准化的token单位。现代分词器通常使用子词单位而非完整单词。"cat"可能对应token ID 537,"...

3710

Anthropic刚刚宣布Claude Sonnet 4支持100万token上下文窗口

用户11563501

刚刚,官方公告,Claude Sonnet 4 的上下文窗口扩大到了 100 万 tokens,是之前的 5 倍。

4010

先买 Token 还是先部署模型?AI 落地的一个灵魂拷问

用户12105527

技术负责人拍桌子:不能上云,数据安全怎么保障?必须买卡本地部署。 预算表已经写好了,显卡加配套服务器,一大笔钱砸进去,周期六到八周。

5600

Token 激增:企业 AI 供应方案

用户12105527

这已经不是技术进步的故事,而是生存竞争的故事。AI 从"可选项"变成了"必选项"。企业的每一次增长,都绑定在 Token 供应的稳定性上。

4210
领券