文
Paper Sharings
Playground
Grocery
Paper Recommendation
字
Editor Download
Login
Register
流
文
搜 索
最新推荐
大语言模型加持下的自动化引擎
LLM
CoT
大语言模型
LLM智能体
爱吃猫的鱼
975
1
发布于11 月,1 周前
深度强化学习中的探索策略
人工智能
强化学习
探索与利用
探索策略
爱吃猫的鱼
1490
1
发布于1 年,9 月前
Robust Speech Recognition via Large-Scale Weak Supervision
鲁棒性
大规模数据集
语音识别
ASR
爱吃猫的鱼
1554
0
发布于1 年,11 月前
视觉语言模型
视觉语言模型
视觉模型
语言模型
爱吃猫的鱼
1825
1
发布于2 年前
BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning
深度学习
安全
预训练模型
攻击
人工智能安全
爱吃猫的鱼
1827
0
发布于2 年,1 月前
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
强化学习
进化算法
自然进化策略
并行
大规模并行
爱吃猫的鱼
1409
0
发布于2 年,3 月前
Bad Characters: Imperceptible NLP Attacks
机器学习
NLP
字符编码攻击
NLP攻击
爱吃猫的鱼
1704
1
发布于2 年,3 月前
Conservative Q-Learning for Offline Reinforcement Learning
强化学习
离线强化学习
分布漂移
价值超估
CQL
爱吃猫的鱼
1951
0
发布于2 年,3 月前
有限样本学习(三):数据生成
有限样本学习
小样本学习
数据增强
数据生成
爱吃猫的鱼
1637
0
发布于2 年,4 月前
Learning Invariant Representations for Reinforcement Learning without Reconstruction
强化学习
表征学习
Bisimulation Metric
环境编码
Bisimulation
爱吃猫的鱼
1878
0
发布于2 年,4 月前
强化学习经典算法实验之REINFORCE
强化学习
cartpole-v0
REINFORCE
gym
算法实现
爱吃猫的鱼
2996
0
发布于2 年,6 月前