English
全部
搜索
图片
视频
短视频
地图
资讯
Copilot
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
56:01
Lecture 4 - Reinforcement Learning - Basics | Reasoning LLMs from Scr
…
已浏览 7784 次
2025年4月17日
YouTube
Vizuara
39:33
Reinforcement Learning with Verifiable Rewards - Teaching LL
…
已浏览 5490 次
6 个月之前
YouTube
Adam Lucek
51:06
How to finetune LLMs to THINK with Reinforcement Learning (GRPO fr
…
已浏览 2.6万 次
10 个月之前
YouTube
Neural Breakdown with AVB
1:10:30
Stanford CS224R Deep Reinforcement Learning | Spring 2
…
已浏览 3754 次
5 个月之前
YouTube
Stanford Online
27:04
I Trained an LLM to Think Deeper (Here's How)
已浏览 1.2万 次
2025年2月24日
YouTube
Adam Lucek
0:36
Master LLM Training with Reinforcement Learning
已浏览 13 次
2 周前
YouTube
Github Signals
1:18:19
Reinforcement Learning for LLMs in 2025
已浏览 1.6万 次
2025年2月10日
YouTube
Trelis Research
20:37
Reinforcement Learning with LLMs: a new era of AI agents
已浏览 3869 次
3 个月之前
YouTube
Shaw Talebi
2:42:28
[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Qu
…
已浏览 11.2万 次
9 个月之前
YouTube
AI Engineer
33:10
Reinforcement Learning (RL) for LLMs
已浏览 1.3万 次
2025年3月12日
YouTube
Natasha Jaques
1:01:58
[UCLA RL-LLM] Chapter 3.2: Reinforcement learning with verifi
…
已浏览 3640 次
10 个月之前
YouTube
Ernest Ryu
24:50
Reinforcement Learning: A (practical) introduction
已浏览 2783 次
3 个月之前
YouTube
Shaw Talebi
1:02:51
Stanford CS224R Deep Reinforcement Learning | Spring 2
…
已浏览 3140 次
5 个月之前
YouTube
Stanford Online
58:44
🔥 Live Demo: Reinforcement Fine-Tuning for LLMs — Build Smarter
…
已浏览 4480 次
2025年4月3日
YouTube
Predibase by Rubrik
9:16
Reinforcement Learning for LLM Reasoning. RL / RLHF / RLAIF.
已浏览 180 次
6 个月之前
YouTube
Byte Goose AI.
32:24
[UCLA RL-LLM] Chapter 0: Course outline and prologue
已浏览 1.3万 次
10 个月之前
YouTube
Ernest Ryu
1:35:48
[UCLA RL-LLM] Chapter 1.1: MDP foundations, imitation learning, an
…
已浏览 7758 次
10 个月之前
YouTube
Ernest Ryu
23:51
Lecture 19 - Applying RL in LLMs | Reinforcement Learning Phase | R
…
已浏览 1954 次
9 个月之前
YouTube
Vizuara
5:04
How LLMs Are Actually Trained: Pre-Training vs. Post-Training Ex
…
已浏览 5919 次
8 个月之前
YouTube
Super Data Science: ML & AI Podcast with Jon …
11:23
Why Reinforcement Learning Unlocks Reasoning in LLMs (Aha
…
已浏览 2279 次
4 个月之前
YouTube
AI Papers Academy
11:29
在视频中查找 01:12
What is Reinforcement Learning?
Reinforcement Learning from Human Feedback (RLHF) Explained
已浏览 8.5万 次
2024年8月7日
YouTube
IBM Technology
1:19:08
Stanford CS234 Reinforcement Learning I Introduction to Reinforc
…
已浏览 15.2万 次
2024年10月30日
YouTube
Stanford Online
15:31
Reinforcement Learning with Human Feedback (RLHF) - How to train an
…
已浏览 3.5万 次
2024年2月12日
YouTube
Luis Serrano Academy
1:33:28
The FASTEST introduction to Reinforcement Learning on the int
…
已浏览 43.7万 次
2024年12月23日
YouTube
Gonkee
2:37:05
在视频中查找 1:20:35
1 bit LLM Indepth Intuition
Fine Tuning LLM Models – Generative AI Course
已浏览 43.5万 次
2024年5月21日
YouTube
freeCodeCamp.org
11:56:26
LLM Fine-Tuning Course – From Supervised FT to RLHF, LoRA, an
…
已浏览 5.7万 次
1 个月前
YouTube
freeCodeCamp.org
28:53
Fine-tuning LLMs on Human Feedback (RLHF + DPO)
已浏览 2.3万 次
2025年3月3日
YouTube
Shaw Talebi
29:38
Training LLM to play chess using Deepseek GRPO reinforcement le
…
已浏览 1.9万 次
2025年3月1日
YouTube
Efficient NLP
13:56
What is Reinforcement Fine-Tuning (RFT) - Supervised vs. RL LLM Re
…
已浏览 3876 次
2025年3月16日
YouTube
What's AI by Louis-François Bouchard
1:00:16
Master Reinforcement Learning With These 3 Projects
已浏览 1.4万 次
2024年10月17日
YouTube
Adam Lucek
观看更多视频
更多类似内容
反馈