小链
添加 登录
LongCat AI
#LLM #美团 #A4 9-7 直达⤴︎
混元3D世界生成开源模型
#LLM #腾讯 #A4 9-7 直达⤴︎
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
#DeepSeek #LLM #A4 8-24 直达⤴︎
Claude 3.7 Sonnet and Claude Code
#Claude #LLM #A4 3-2 直达⤴︎

Claude 3.7 Sonnet 是目前最智能的云端语言模型之一,也是市场上首款兼具即时响应与逐步推理能力的混合模型。

OpenAI 发布 GPT 4.5 大模型
#LLM #AI #OpenAI 3-2 直达⤴︎
浙江大学:大模型基础
#教程 #LLM #文档 2-18 直达⤴︎

这篇技术文档围绕大语言模型展开,全面介绍了语言模型基础、大语言模型架构、Prompt 工程、参数高效微调、模型编辑、检索增强生成等内容,还探讨了大语言模型面临的挑战和未来发展方向。

在Mac上部署DeepSeek R1模型,设置知识库对话、peompt等 | 张洪Heo
#LLM #AI #DeepSeek #自部署 2-3 直达⤴︎

想了一下感觉没啥意义,放弃部署。

3小时完全从0训练26M的小参数GPT!
已发布 #AI #LLM 2-1 直达⤴︎
Qwen Chat
已发布 #AI #LLM 1-29 直达⤴︎

阿里千问大模型。从联系方式看,好像是官方的。

DeepSeek-V3-Base
#AI #LLM 12-26 直达⤴︎

收藏不用系列

Deepseek V3 开源 在 aider 多语言编程测评超过了 Claude 3.5 sonnet V2 Deepseek V2.5 的时候成功率只有 17%,现在暴增到了 48% ! 采用 685B 参数的 MoE 架构 包含 256 个专家,使用 sigmoid 路由方式,每次选取前 8 个专家 (topk=8)

一篇文章系统看懂大模型
待精读 #教程 #AI #LLM 12-24 直达⤴︎

这篇文章是一篇关于大模型(Large Language Models,LLM)的系统性解读,由作者“三白有话说”撰写,旨在帮助读者全面理解大模型的概念、技术、应用和局限性。

待办事项

整理 了解 部署 发布 购买 试用 精读 常读


标签列表

AI 141A4 137投资 91List 46文档 31看世界 30教程 25RSS 22Prompt 22必读 20灵感 20自部署 19AI编程 18趋势 16设计 15未来 14DeepSeek 14创业 13LLM 12开源 12美团 11阅读 11预测 11旅行 10稀奇 10美国 10自媒体 10影视 9有趣 9Markdown 9Passwall 9NAS 8日本 8游戏 8移民 8A16Z-25 8AI 叙事 8图片处理 8Agent 7Cusor 7翻译 7拼多多 7Mac 6Google 6书单 6写作 6欧洲 6科普 6英语 6阿里 6Paywall 6特朗普 6每周一书 6IPO 5Github 5人物 5新闻 5点子 5神器 5羊毛 5腾讯 5AI叙事 5数字游民 5社会观察 5DIY 4OpenAI 4书签 4作图 4小米 4田野 4AI 应用 4可视化 4小红书 4机器人 4量子计算 4HN 3APP 3MCP 3PDF 3Icon 3Manus 3Reddit 3世界 3健康 3博客 3扩展 3插件 3数学 3模板 3网盘 3观点 3资源 3配色 3AI搜索 3订阅源 3类Linktree 3Landing page 3UI 2API 2N8N 2Blog 2B站 2Emby 2Wiki 2Tools 2Claude 2Kindle 2Policy 2主题 2京东 2关税 2出海 2创新 2同步 2图库 2图标 2字体 2开发 2播客 2政策 2效率 2日语 2杂志 2李想 2消费 2爬虫 2理想 2电影 2相册 2笔记 2网文 2耳聋 2视频 2记账 2金句 2音乐 2Linuxdo 2Youtube 2AI作图 2AI应用 2AI投资 2AI视频 2Blogroll 23D 打印 2AI 聚合 2AI 视频 2云旅行 2亚马逊 2加拿大 2发布会 2吉卜力 2巴菲特 2手机卡 2效果图 2新加坡 2新西兰 2服务器 2段永平 2电子书 2自动化 2英伟达 2临时邮箱 2公司研究 2电话会议 2脊柱侧弯 2读书笔记 24 14A 1IT 1PT 1TV 1CSS 1ETF 1GPT 1IOT 1OCR 1PPT 1SVG 1A16Z 1Hugo 1Logo 1Musk 1TODO 1eSIM 1list 1uses 1A 股 1Apple 1B 站 1Austin 1Gemini 1Vercel 1下载 1中美 1书籍 1人口 1企业 1传记 1低空 1军事 1出版 1刷卡 1医学 1医疗 1协作 1印度 1咖啡 1国债 1图床 1地图 1声音 1大学 1大神 1奇幻 1字幕 1宗教 1小说 1小鹏 1工商 1应用 1徒步 1徕芬 1微软 1德国 1思想 1思维 1手办 1扫描 1携程 1教育 1数据 1文件 1族谱 1早教 1晚点 1景林 1机场 1汽车 1法律 1注册 1滴滴 1火星 1电商 1留学 1白板 1百度 1盈透 1看图 1硬件 1穿透 1简历 1终端 1经验 1统计 1维修 1美剧 1育儿 1脑图 1脑机 1艺术 1芯片 1英国 1荷兰 1菜谱 1营销 1访谈 1评测 1调研 1贝壳 1财务 1跑步 1跨境 1转换 1逻辑 1邮件 1邮箱 1邮轮 1金融 1香港 1骑行 1魔方 1鸡汤 1黑镜 1Android 1ChatGPT 1Typecho 1AI产品 1AI内容 1AI声音 1AI学习 1AI对话 1AI游戏 1AI研究 1AI硬件 1AI绘图 1Telegram 1giffgaff 1AI 作图 1AI 技巧 1AI 搜索 1AI 设计 1AI 陪伴 1Neuralink 1Obisidian 1Wordpress 1专家会 1业绩会 1云音乐 1企业史 1何小鹏 1信用卡 1冷知识 1台积电 1吴哥窟 1图书馆 1多抓鱼 1大数据 1奥特曼 1尼泊尔 1微博客 1房地产 1显示器 1朱啸虎 1桑基图 1梁文锋 1比特币 1照片墙 1特斯拉 1王慧文 1电话会 1罗永浩 1落脚页 1输入法 1达利欧 1预览图 1Blockchain 1世界公民 1中美关系 1产品经理 1任务管理 1名创优品 1图片压缩 1字节跳动 1心理咨询 1投资策略 1数据分析 1有趣的人 1每周一人 1每周一企 1泡泡玛特 1蜜雪冰城 1行业研究 1项目管理 1飞行汽车 1
友情链接 | 备案信息