UEDBETapp登录 卡帕西解锁大模子新玩法!构建个东说念主学问库,“大部分Token依然不跑代码了”

UEDBETAPP官方网站
UED盘口
UEDBETAPP官方网站
你的位置:UEDBETAPP官方网站 > UED盘口 >
UEDBETapp登录 卡帕西解锁大模子新玩法!构建个东说念主学问库,“大部分Token依然不跑代码了”
发布日期:2026-04-06 07:09    点击次数:200

UEDBETapp登录 卡帕西解锁大模子新玩法!构建个东说念主学问库,“大部分Token依然不跑代码了”

Karpathy 大模子新玩法热乎出炉!

此次是新瓶装老酒——用 AI 搭建个东说念主学问库。

怎样说呢?能让卡神亲身动手,就注定这个学问库还真和咱思象的不相似。

比如畴昔最烦的少许——一朝你懒得更新,学问库就废了,在卡神这里却变成了一个"懂得我方更新、还能越用越灵敏"的小可人。

何况还不啻于此。

连卡神我方都绷不住,直言咫尺大部分 Token 都不是用来写代码,而是拿来跑学问库了。

是以问题来了,卡神的学问库到底有啥不相似?

别急,看完他顺手附赠的搭建教程你就显着了。

卡帕西教你这么搭个东说念主学问库

运行之前不得不感叹一句——卡帕西的《个东说念主学问库搭建教程》来得刚刚好。

这两天正愁怎样把四解决散且越积越多的贵寓,信得过千里淀下来。

好多时间都是看完就忘、一找就废——保藏的著作躺在文献夹里吃灰,读过的论文回头就思不起论断,前次踩过的坑下次照样再踩一遍。信息越多,脑子越乱,信得过要用的时间,反而什么都翻不到。

说白了,我需要的即是一个能替我记着、替我整理、还能随叫随到的东西。

而卡帕西此次给的,恰恰即是这个。

第一步:导入数据。

诚然用上 AI 了,但学问库最最基础的准备责任如故免不了——仍需要手动导入原始贵寓。

不外卡帕西也说了,这项责任仅仅早期有点累,等后头 AI 老练你的责任作风了,导入的神气也会更浅近。

比如你俩熟了后,只需说一句"把这个新文档存到咱们的维基里",以至径直给个旅途,AI 就能自动归类、自动打标签、自动关联到关系内容。

具体来说,这一步需要你把总计贵寓打包进一个文献夹(raw/)——进程中无需东说念主工致理。

然后让大模子襄助干一件事:

把 raw/ 里前仰后合的贵寓,编译成一个井井有条的维基百科。

这个维基百科现实上即是一堆 Markdown 文献,但内容依然实足不相似了,内部包含:

摘记:每篇著作 / 论文 / 代码,模子先读一遍,然后写个简短的摘记;

反向蚁合:不同内容之间会自动开发反向蚁合;

办法分类:模子会判断"这篇著作讲的是 Transformer ",然后把它归到"深度学习 / 提防力机制"这个分类下;

新著作:模子以至会字据已有贵寓撰写出新的内容。

最终,总计贵寓采集在一王人,会酿成一个彼此援用的学问蚁集(即是你印象当中的阿谁维基)。

对了,为了将网页和图片也转成 Markdown,卡帕西还分享了我方的器用—— Obsidian Web Clipper 插件。

正常看到好著作的时间,星空app官网版径直点一下插件就能将网页转成 .md 文献,趁机再把图片一键下载到腹地(os:不下载的话,要是哪天网站崩了图也就没了 ~)。

第二步:前端搜检数据。

等 AI 整理完数据后,咱们不错在前端搜检原始数据(raw/)、编译好的维基,以及生成的可视化图表。

卡帕西这里用的是 Obsidian ——它不啻不错当浏览面板,还自带一些插件(比如用 Marp 生成幻灯片)。

何况他还专诚提到,维基里的所少见据,基本都是由大模子来编写和选藏的,我方险些从不径直动手修改。

第三步:用起来、跑起来。

一朝数据累积的敷裕多,且被 AI 整理得井井有条后,接下来天然是用起来了。

卡帕西分享说念,我方最近有项接头的维基攒了 100 篇著作(约 40 万字),本以为这个限制得搞一套复杂的 RAG(检索增强生成)技巧才行。

效劳发现:根底不需要。

独一大模子正常把索引文献和摘记选藏好了,哪怕 40 万字的限制,它也能相对轻便地读取总计迫切关总计据,然后给出高质地的请教。

何况卡帕西忠诚夸赞,大模子在自动选藏索引和摘记方面"进展特出好"。

以及最迫切的一步来了——总计输出效劳不是给了就收场,UEDBETapp下载而是被存档到维基中,酿成轮回。卡帕西暗意:

通常,我会把这些输出效劳"存档"回维基,为后续查询作念准备。

这么一来,我我方的每一次探索和发问,都会在学问库中不断千里淀、握续累积。

划要点,光我方补还不够。为了让通盘系统保握更新,卡帕西还补了两层要津才智:

一是专门盘算了一层" Lint+Heal "机制,现实上即是让大模子按期扫描通盘学问库,自动发现不一致的数据、补全缺失信息,以至主动建议新增条件,必要时还不错通过外部搜索把空白补王人。

二是在更底层,提供了一套 CLI 器用,用来给学问库提供搜索和探问接口——一方面让大模子不错高效检索和读取内容,另一方面也便捷东说念主通过高歌行或网页径直使用这套学问库。

到这里,通盘学问库才信得过"活起来"。

你会发现,它和传统学问库依然实足不是一趟事了:

畴昔的学问库,现实是一个需要东说念主不断选藏的"存储器用",而在卡帕西这里,它变成了一个由大模子握续整理、握续更新的"运行系统"——

不是一个单纯的"搜索引擎",而是不错不断长出新学问的"第二大脑"。

在网友看来,卡帕西正在展示一种信得过灵验的、最浅近的 AI 架构:

将接头贵寓存入文献夹,让模子将其组织成维基,建议问题,然后将谜底存回。

信得过的洞见在于这个轮回……每个查询都让维基变得更好。它不断累积,咫尺这就像一个自我构建的第二大脑。

这下无须卷高下文了?

而一朝有了这么的学问库,东说念主们会俄顷发现:

好像也不需要再一味拚命卷高下文窗口了?

畴昔大众卷高下文,是因为 AI 总是容易"说着说着就忘了以前的内容",越到后头越答非所问。

中枢要害就一个——记念问题。

然则咫尺,情况变了。

蓝本需要一次性塞进高下文的贵寓,被千里淀进了个东说念主学问库里,模子不再强行记念,而是按需读取、按需使用。

于是通盘逻辑透澈反过来了:

你每次提供的信息不再是"临时的",而是在学问库里"永久存储";每一次用也不是纯糟践,而是在给学问库不断补充新学问。

对模子来说,它也不需要时刻记着一切,而是只需要知说念"什么东西在那里"。

现实上,这其实是从"让模子记着",变成了"让系统可查找"。

而这一瞥变,按网友的话来说,其影响在智能体期间将愈加"豪恣"。

我以为要是正确利用(卡帕西的这种个东说念主学问库),这对智能体来说相配好。

不再是每轮对话都从分享内存中临时索要信息,而是构建一个握续存在的、有人命力的学问库。

你的合作家(Agent)不再仅仅合作任务……它还在选藏机构化的学问,这么每一次践诺都会为学问库增添一些东西。

更大的影响是豪恣的。

领有我方学问层的 Agent,并不需要无穷的高下文窗口——它们只需要简易的文献组织才智,以及读取我方索引的才智。

这比把总计东西都塞进一个遍及的领导词里,更低廉、膨大性更强、也更容易查验和领路。

参考蚁合:

[ 1 ] https://x.com/karpathy/status/2039805659525644595

[ 2 ] https://x.com/jumperz/status/2039826228224430323

一键三连「点赞」「转发」「注意心」

迎接在筹商区留住你的思法!

—  完  —

� � 谁会代表 2026 年的 AI?

龙虾爆火,带动一波 Agent 与繁衍居品海潮。

但真适值得永久可贵的 AI 公司和居品,大约不啻于此。

要是你正在作念,或见证着这些变化,迎接呈报。

让更多东说念主看见你。� � https://wj.qq.com/s2/25829730/09xz/

一键可贵 � � 点亮星标

科技前沿进展逐日见UEDBETapp登录

开云app官方在线入口