程序员面试、算法研究、机器学习、大模型/ChatGPT/AIGC、论文审稿、具身智能/人形机器人、RAG等16大系列集锦

程序员面试、算法研究、编程艺术、红黑树、机器学习5大经典原创系列集锦与总结作者：July--结构之法算法之道blog之博主。时间：2010年10月-2018年5月，一直在不断更新中..出处：http://blog.csdn.net/v_JULY_v。说明：本博客中部分文章经过不断修改、优化，已集结出版成书《编程之法：面试和算法心得》。前言开博4年有余，...

v_JULY_v

761691人浏览 · 2020-01-05 20:42:56

v_JULY_v · 2020-01-05 20:42:56 发布

作者：July，七月在线创始人兼CEO、结构之法算法之道blog之博主
时间：2010年10月-2024年12月，一直在不断更新中..
出处：http://blog.csdn.net/v_JULY_v

前言

第一部分经典重温：微软面试、算法研究、编程艺术、红黑树系列

第二部分从AI到大模型：机器学习、ChatGPT、改造Transformer、AIGC与多模态等

五、机器学习十大算法系列

5.1 AI数学基础

5.2 AI工程实践

5.3 AI经典模型：从SVM XGBoost CNN RNN LSTM

六、大模型与ChatGPT系列：原理、论文、代码、应用

6.1 ChatGPT与o1的原理与实现系列

6.2 国内外类ChatGPT：比如Llama2、Llama3、Llama3.1

6.3 大模型背后的关键技术与前沿发展：LoRA/并行训练/长度扩展

6.4 医疗及LLM与KG、DB的结合

七、对Transformer的各种改进与挑战：mamba、KAN、TTT、vLLM及各种注意力等

7.1 改进Transformer与注意力：KAN、TTT、Flash Attention、PagedAttention

7.2 挑战Transformer：mamba、mamba2、mamba各种变体

八、火爆全球的DeepSeek系列模型：涉及V3、R1的原理及其复现

8.1 DeepSeek V2/V3系列

8.2 DeepSeek R1系列

九、AIGC与CV多模态：图像/视频/代码生成/自动驾驶

9.1 AIGC/AI绘画/CV多模态/图像生成、提问VLM项目

9.2 视频生成，含OpenAI首个视频生成模型sora

9.3 其他生成：代码生成

9.4 自动驾驶大模型

第三部分大模型加速驱动协作机器人、具身智能、人形机器人的发展

十、ALOHA/umi/dexcap中的模仿学习与动作预测

10.1 模仿学习的集中爆发：斯坦福机器人Mobile Aloha、UMI、DexCap、SRT

10.2 预训练 + RL机器人

十一、VLA发展史：从Robotics VLM到VLA

11.1 始于RT2

11.2 从robot VLM到VLA

十二、通用机械臂之路: π0等VLA sota模型

12.1 机器人大模型之演变

12.2 开源vla sota π0模型，涉及源码剖析、微调等

十三、具身背景之下：iDP3等人形机器人的复现与开发

13.1 斯坦福HumanPlus系列

13.2 斯坦福的iDP3系列，包含全套代码的解析

13.3 CMU、UC San Diego的各个人形机器人，比如OmniH2O、TeleVision等

13.4 通用人形之路，比如Figure 02的Helix

第四部分我司七月的部分大模型实践：科研论文大模型、RAG、智能体等

十四、七月科研论文大模型：含论文的审稿微调、阅读、写作、修订

14.1 七月论文审稿GPT(从第1版到第6版)

14.2 论文的阅读：基于大模型的翻译系统、检索、摘要、对话系统

14.3 论文的写作：idea的提出(涉及论文的抓取检索召回排序提炼)

14.4 七月硕士论文助手——论文修订、语法纠错、润色等

十五、RAG知识库问答系列

15.1 七月RAG第一版之探索，基本流程与基本框架

15.2 七月RAG第二版之探索，通用文档处理

前言

开博10年有余，回首这10余年，自己一开始侧重编程、面试、数据结构/算法，中途侧重数据挖掘、机器学习，近期则专攻AIGC/ChatGPT，而自己在本blog上也着实花费了巨大的时间和精力，写的东西可能也够几本书的内容了。然不管怎样，希望我能真真正正的为读者提供实实在在的价值与帮助

比如，下图是2023年ChatGPT、大模型、具身智能大爆发之前，每一年所写的文章

下面，敬请观赏。有任何问题，欢迎随时不吝指正(同时，若你也能帮助回复blog内留言的任何朋友的问题，欢迎你随时不吝分享&回复，我们一起讨论，互帮互助，谢谢)

第一部分经典重温：微软面试、算法研究、编程艺术、红黑树系列

四、红黑树、B树、R树、Trie树

第二部分从AI到大模型：机器学习、ChatGPT、改造Transformer、AIGC与多模态等

五、机器学习十大算法系列

5.1 AI数学基础
概率统计极简入门：通俗理解微积分/期望方差/正态分布前世今生(23修订版)
一文通透优化算法：从随机梯度、随机梯度下降法到牛顿法、共轭梯度
..
5.2 AI工程实践
一文读懂特征工程
教你从头到尾利用DL学梵高作画：GTX 1070 cuda 8.0 tensorflow gpu版
没GPU也能玩梵高作画：Ubuntu tensorflow CPU版
基于torch学汪峰写歌词、聊天机器人、图像着色/生成、看图说话、字幕生成
教你从头到尾利用DQN自动玩flappy bird（全程命令提示，GPU+CPU版）
手把手教你搭建caffe及手写数字识别（Ubuntu下且附mac、纯通俗教程）
如何从零起步学习AI（附学习路线）
GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）
Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛
BAT机器学习面试1000题系列（第1~500题）
5.3 AI经典模型：从SVM XGBoost CNN RNN LSTM
数据挖掘领域十大经典算法初探
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法，2012年11月
从决策树学习谈到贝叶斯分类算法、EM、HMM，2012年5月
支持向量机通俗导论（理解SVM的三层境界） PDF下载 LaTeX版本1 LaTeX版本2，2012年6月
最大熵模型中的数学推导，2014年10月
如何通俗理解EM算法，2018年8月
Adaboost 的原理与推导 LaTeX版本下载，2014年11月
从拉普拉斯矩阵说到谱聚类，2014年11月
从贝叶斯方法谈到贝叶斯网络 LaTeX版本下载，2014年11月
通俗理解LDA主题模型 LaTeX版本下载，2014年11月
CNN笔记：通俗理解卷积神经网络，2016年7月
图解CNN：通过100张图一步步理解CNN，2018年3月
一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD，2018年5月
通俗理解kaggle比赛大杀器xgboost，2018年8月
如何从RNN起步，一步一步通俗理解LSTM，2019年5月
如何通俗理解Word2Vec，2019年10月首发，后2023年全面修订
GNN通俗笔记：图神经网络在推荐/广告中的应用，2021年3月
通俗理解卡尔曼滤波（感知融合的经典算法），2021年9月
..

六、大模型与ChatGPT系列：原理、论文、代码、应用

七、对Transformer的各种改进与挑战：mamba、KAN、TTT、vLLM及各种注意力等

八、火爆全球的DeepSeek系列模型：涉及V3、R1的原理及其复现

九、AIGC与CV多模态：图像/视频/代码生成/自动驾驶

第三部分大模型加速驱动协作机器人、具身智能、人形机器人的发展

十、ALOHA/umi/dexcap中的模仿学习与动作预测

十一、VLA发展史：从Robotics VLM到VLA

十二、通用机械臂之路: π0等VLA sota模型

十三、具身背景之下：人形机器人的发展

十四 iDP3等通用人形机器人的复现与开发

14.1 斯坦福的iDP3系列，包含全套代码的解析
斯坦福通用人形策略iDP3——同一套策略控制各种机器人：改进3D扩散策略，不再依赖相机校准和点云分割
iDP3的Learning代码解析：逐步分解iDP3的数据集、模型、动作预测策略代码(包含2D和3D两个版本)
iDP3的训练与部署代码解析：从数据可视化vis_dataset.py、训练脚本train.py到部署脚本deploy.py
iDP3的人形遥操代码分析：从数据收集、数据转换到VR安装、人形机器人遥控
14.2 通用人形之路，比如Figure 02的Helix
英伟达HOVER——用于人形机器人的多功能全身控制器：整合不同的控制模式且实现彼此之间的无缝切换
Helix——Figure 02发布通用人形机器人控制的VLA：一组神经网络权重下的快与慢双系统，让两个机器人协作干活
ViLLA——智元发布首个通用具身基座模型：Genie Operator-1，提出Vision-Language-Latent-Action架构(含AgiBot World简介)

第四部分我司七月的部分大模型实践：科研论文大模型、RAG、智能体等

十五、七月科研论文大模型：含论文的审稿微调、阅读、写作、修订

15.1 七月论文审稿GPT(从第1版到第6版)
23年Q3至24年Q1：第一轮
七月论文审稿GPT第1版：通过3万多篇paper和10多万的review数据微调RWKV
七月论文审稿GPT第2版：用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4
七月论文审稿GPT第2.5和第3版：分别微调GPT3.5、Llama2 13B以扩大对GPT4的优势
~~七月论文审稿GPT第3.2版和第3.5版：通过paper-review数据集分别微调Mistral、gemma~~
一文速览Mistral 7B及其微调——我司论文审稿GPT第3.2版：微调Mistral 7B instruct 0.2
七月论文审稿GPT第4版：通过paper-review数据集微调Mixtral-8x7b，对GPT4胜率超过80%
七月论文审稿GPT第4.2版：通过15K条paper-review数据微调Llama2 70B(含各种坑)
24年Q2至24年Q3：第二轮
提升大模型数据质量的三大要素：找到早期paper且基于GPT摘要出来7方面review(七月论文审稿GPT第4.5/4.6/4.8版)
微调LLama 3——七月论文审稿GPT第5版：拿早期paper-7方面review数据集微调LLama 3
一文速览Gemma 2及其微调：从论文审稿GPT第3.5版(微调Gemma)，到第5.2版(早期paper-7方面review微调Gemma2)
微调LLama 3.1——七月论文审稿GPT第5.5版：拿早期paper-review数据集微调LLama 3.1
...
康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)
..
15.2 论文的阅读：基于大模型的翻译系统、检索、摘要、对话系统
学术论文GPT的源码解读与二次开发：从ChatPaper到gpt_academic
// 待更..
15.3 论文的写作：idea的提出(涉及论文的抓取检索召回排序提炼)
基于大模型的idea提炼：从ResearchAgent，到斯坦福的AI-Researcher、上海AI实验室的VIRSCI
让AI写论文——全流程全自动的AI科学家：基于大模型提炼idea、写代码、做实验且最终写成论文
..
15.4 七月硕士论文助手——论文修订、语法纠错、润色等
// 待更

十六、RAG知识库问答系列

16.1 七月RAG第一版之探索，基本流程与基本框架
LangChain+LLM的本地知识库问答：从企业单文档问答到批量文档问答
知识库问答LangChain+LLM的二次开发：商用时的典型问题及其改进方案
一文通透Text Embedding模型：从text2vec、openai-ada-002到m3e、bge
一文掌握文本语义分割：从朴素切分、Cross-Segment到阿里SeqModel
16.2 七月RAG第二版之探索，通用文档处理
从零实现本地知识库问答——详解基于OCR和文本解析器的新一代RAG引擎：RAGFlow(含源码剖析)

十七、智能体Agent项目

十八、其它重要文章节选

18.1、经典数据结构 & 算法系列
精通八大排序算法系列：一之续、快速排序算法的深入分析

几个最短路径算法Floyd、Dijkstra、Bellman-Ford、SPFA的比较
18.2、数据处理/网站架构系列
从Hadhoop框架与MapReduce模式中谈海量数据处理

MapReduce技术的初步了解与学习

海量数据处理之Bloom Filter详解

从上百幅架构图中学大型网站建设经验（上）
Chrome源码剖析、上--多线程模型、进程通信、进程模型
Nginx源码剖析之内存池，与内存管理
18.3、推荐 & 搜索算法系列
细数二十世纪最伟大的10大算法
当今世界最为经典的十大算法--投票进行时（本blog将评选出当今世界最为经典的十大算法）
推荐引擎算法学习导论
搜索引擎技术之概要预览
18.4、其它
程序员如何快速准备面试中的算法
重启开源，分享无限--诚邀你加入微软面试187题的解题中
敏捷软件开发模型Scrum通俗讲义
由快速排序引申而来--如何学习算法
Machine Learning读书会,面试算法讲座,创业活动,算法班(14年10月) （含所有线下讲座PPT 集锦）
结构之法算法之道blog博文集锦第6、第7期CHM文件第8期第9期下载（第9期截止到2014年12月9日）
....

后记

世上本无路，走的人多了，也就成了路。世上本无免费的午餐，分享的人多了，也就造就了开源的辉煌

如果你发现了本blog中的任何一问题，请一定不吝指正，thanks。此外，你可以永久通过搜索引擎搜索本博客名称的前4个字，即：“结构之法” 这4个关键字，进入本博客。最后，感谢CSDN，感谢所有一直以来关注本blog的所有朋友。谢谢大家，谢谢。

转发送书

欢迎大家转发下条微博：Sina Visitor System，我会不定期抽奖，经典IT图书大赠送：

2024.09.19最新更新：2015年，July团队正式创业，创办七月在线，一开始做教育，后扩科技，如今是「集AI大模型教育、应用开发、机器人解决方案为一体的科技公司」

智灵弹性算力系统

为开发者提供按需使用的算力基础设施。

更多推荐

Python中超好用的split()函数，详解

智灵弹性算力系统

Python——sklearn库的安装

Python——sklearn库的安装做个笔记，时间久了，都忘了sklearn库的标准名字——scikit-learn。所以，不要用pip install sklearn应该是pip install scikit-learn真被自己蠢哭了。说明：有的低版本的sklearn库没有"accuracy"，版本问题，更新一下包就可以哈。...

智灵弹性算力系统

VScode上配置python环境过程

智灵弹性算力系统

所有评论(0)

查看更多评论

v_JULY_v

@v_JULY_v

已为社区贡献3条内容

程序员面试、算法研究、机器学习、大模型/ChatGPT/AIGC、论文审稿、具身智能/人形机器人、RAG等16大系列集锦

v_JULY_v

前言

第一部分 经典重温：微软面试、算法研究、编程艺术、红黑树系列

一、微软面试100题系列

二、十五个经典算法研究与总结、目录+索引

三、程序员编程艺术第一~四十章集锦与总结

四、红黑树、B树、R树、Trie树

第二部分 从AI到大模型：机器学习、ChatGPT、改造Transformer、AIGC与多模态等

五、机器学习十大算法系列

5.1 AI数学基础

5.2 AI工程实践

5.3 AI经典模型：从SVM XGBoost CNN RNN LSTM

六、大模型与ChatGPT系列：原理、论文、代码、应用

6.1 ChatGPT与o1的原理与实现系列

6.2 国内外类ChatGPT：比如Llama2、Llama3、Llama3.1

6.3 大模型背后的关键技术与前沿发展：LoRA/并行训练/长度扩展

6.4 医疗及LLM与KG、DB的结合

七、对Transformer的各种改进与挑战：mamba、KAN、TTT、vLLM及各种注意力等

7.1 改进Transformer与注意力：KAN、TTT、Flash Attention、PagedAttention

7.2 挑战Transformer：mamba、mamba2、mamba各种变体

​八、火爆全球的DeepSeek系列模型：涉及V3、R1的原理及其复现

8.1 DeepSeek V2/V3系列

8.2 DeepSeek R1系列

九、AIGC与CV多模态：图像/视频/代码生成/自动驾驶

9.1 AIGC/AI绘画/CV多模态/图像生成、提问VLM项目

9.2 视频生成，含OpenAI首个视频生成模型sora

9.3 其他生成：代码生成

9.4 自动驾驶大模型

第三部分 大模型加速驱动协作机器人、具身智能、人形机器人的发展

十、ALOHA/umi/dexcap中的模仿学习与动作预测

10.1 模仿学习的集中爆发：斯坦福机器人Mobile Aloha、UMI、DexCap、SRT

10.2 预训练 + RL机器人

十一、VLA发展史：从Robotics VLM到VLA

11.1 始于RT2

11.2 从robot VLM到VLA

十二、通用机械臂之路: π0等VLA sota模型

12.1 机器人大模型之演变

12.2 开源vla sota π0模型，涉及源码剖析、微调等

十三、具身背景之下：人形机器人的发展

13.1 斯坦福HumanPlus系列

13.3 CMU、UC San Diego的各个人形机器人，比如OmniH2O、TeleVision等

十四 iDP3等通用人形机器人的复现与开发

14.1 斯坦福的iDP3系列，包含全套代码的解析

14.2 通用人形之路，比如Figure 02的Helix

第四部分 我司七月的部分大模型实践：科研论文大模型、RAG、智能体等

十五、七月科研论文大模型：含论文的审稿微调、阅读、写作、修订

15.1 七月论文审稿GPT(从第1版到第6版)

15.2 论文的阅读：基于大模型的翻译系统、检索、摘要、对话系统

15.3 论文的写作：idea的提出(涉及论文的抓取 检索 召回 排序 提炼)

15.4 七月硕士论文助手——论文修订、语法纠错、润色等

十六、RAG知识库问答系列

16.1 七月RAG第一版之探索，基本流程与基本框架

16.2 七月RAG第二版之探索，通用文档处理

十七、智能体Agent项目

17.1 AI Agent

十八、其它重要文章节选

18.1、经典数据结构 & 算法系列

18.2、数据处理/网站架构系列

18.3、推荐 & 搜索算法系列

18.4、其它

后记

转发送书

所有评论(0)

v_JULY_v

第一部分经典重温：微软面试、算法研究、编程艺术、红黑树系列

第二部分从AI到大模型：机器学习、ChatGPT、改造Transformer、AIGC与多模态等

八、火爆全球的DeepSeek系列模型：涉及V3、R1的原理及其复现

第三部分大模型加速驱动协作机器人、具身智能、人形机器人的发展

第四部分我司七月的部分大模型实践：科研论文大模型、RAG、智能体等

15.3 论文的写作：idea的提出(涉及论文的抓取检索召回排序提炼)