爱吃猫的鱼 - 字舞流文

爱吃猫的鱼

1 粉丝

关于

查看论文分享

爱吃猫的鱼

[本]通信工程@河海大学 & [硕]CS@清华大学

这个人很懒，他什么也没有写!

email: thu-yaowenbing@outlook.com

发布于 2023年10月10日 16:49

大语言模型加持下的自动化引擎

简介: 使用LLM（large language model, 大语言模型）来构建智能体的核心部件是一个非常酷的概念。验证此概念的一些应用，比如：AutoGPT、GPT-Engineer以及BabyAGI等，都给出了令人鼓舞的结果。LLM的潜力不会局限于文本重写优化或者写小说、发言稿和程序，它也可以用于构建一个强大的、解决一般问题的框架。

LLM CoT 大语言模型 LLM智能体

328

1

0

发布于 2022年11月21日 14:58

深度强化学习中的探索策略

简介: 在强化学习中，探索与利用是一个非常重要的主题。我们希望智能体可以尽可能快地找到最佳解决方案。而同时，在没有经过足够探索的情况所获取到的策略可能很糟糕。它很有可能是一个局部最优方案或者是一个失败的方案。以最大回报率为优化目标的现代强化学习算法可以非常高效地实施“利用”这一过程，但是，如何进行探索一直是一个开放讨论的话题。

人工智能强化学习探索与利用探索策略

810

1

0

发布于 2022年9月2日 02:53

视觉语言模型

简介: 据图片来生成文本的任务（比如图片描述/视觉问答等）已经被研究了好些年。传统解决这类问题的系统通常会将一个对象检测网络用作一个视觉特征编码器，而后再利用一个解码器将特征向量解码为文字。由于当前此类研究数量太大，在这里我仅关注这其中的一类解决视觉语言任务的方法。

视觉语言模型视觉模型语言模型

1243

1

0

发布于 2022年4月29日 03:15

有限样本学习（三）：数据生成

简介: 这是有限样本学习的第三方部分内容。我们考虑两种生成训练数据的方法：数据增强与生成新数据。

有限样本学习小样本学习数据增强数据生成

974

0

0

发布于 2022年3月11日 17:16

【学术毒鸡汤】ICLR 2022 论文数据分析：你离成功只差不到一个单词

简介: 2022 年ICRL 论文结果公布，根据我爬到的数据，最终投稿的共有2658篇论文，接收1095篇论文，接收率高达41.2%。（不得不怀疑一下灌水质量）

ICLR 2022 论文数据统计学术毒鸡汤 ICLR

13461

0

0

发布于 2022年3月7日 22:34

强化学习经典算法实验之DQN

简介: DQN论文是 DeepMind 的研究人员在2013年发表的。一作作者Volodymyr Mnih博士毕业于多伦多大学，对人工智能领域特别是强化学习有杰出贡献。DQN的论文首次使用卷机神经网络直接处理游戏画面来进行Atari游戏的控制。

强化学习 DQN Atari 算法实验 openai gym

3715

0

0

发布于 2022年3月4日 18:43

有限样本学习（二）：主动学习

简介: 这是有限样本学习的第二部分内容。这次，我们允许使用有限的预算来进行人工打标签的工作。由于预算有限，我们必须非常谨慎地去选取待标记样本。

深度学习人工智能有限样本学习主动学习 Active Learning

12769

1

0

发布于 2022年2月19日 00:07

常用激活函数及其梯度可视化

简介: 本文给出了pytorch里面支持的所有二十几种激活函数的可视化作图。

机器学习人工智能神经网络可视化激活函数

6360

0

0

发布于 2021年12月23日 16:45

有限样本学习（一）：半监督学习

简介: 简介在监督学习中，高质量的标签是任务性能的保障。然而，给大量的数据样本打标签的代价是非常昂贵的。由此，机器学习中诞生了一些新的范式，专门用于解决在标签非常缺乏的情况下的学习问题。在这些范式中，半监督学习是一个可选方案（半监督学习仅需依赖很少部分打过标签的数据+大量无标签数据）。

机器学习人工智能半监督学习微调预训练

5827

0

0

发布于 2021年11月9日 23:34

对比表征学习(Contrastive Representation Learning)

简介: 对比学习(Contrastive Learning)的主要思想是让相似样本表征间的距离相近，而差别很大样本表征间的距离较远。对比学习在监督学习和非监督学习中都可以使用，在许多的计算机视觉和自然语言处理相关的任务中都有很好的性能表现。

机器学习对比表征学习对比学习表示学习

3745

0

0

发布于 2023年10月10日 16:49

大语言模型加持下的自动化引擎

简介: 使用LLM（large language model, 大语言模型）来构建智能体的核心部件是一个非常酷的概念。验证此概念的一些应用，比如：AutoGPT、GPT-Engineer以及BabyAGI等，都给出了令人鼓舞的结果。LLM的潜力不会局限于文本重写优化或者写小说、发言稿和程序，它也可以用于构建一个强大的、解决一般问题的框架。

LLM CoT 大语言模型 LLM智能体

328

1

0

发布于 2022年11月21日 14:58

深度强化学习中的探索策略

简介: 在强化学习中，探索与利用是一个非常重要的主题。我们希望智能体可以尽可能快地找到最佳解决方案。而同时，在没有经过足够探索的情况所获取到的策略可能很糟糕。它很有可能是一个局部最优方案或者是一个失败的方案。以最大回报率为优化目标的现代强化学习算法可以非常高效地实施“利用”这一过程，但是，如何进行探索一直是一个开放讨论的话题。

人工智能强化学习探索与利用探索策略

810

1

0

发布于 2022年9月2日 02:53

视觉语言模型

简介: 据图片来生成文本的任务（比如图片描述/视觉问答等）已经被研究了好些年。传统解决这类问题的系统通常会将一个对象检测网络用作一个视觉特征编码器，而后再利用一个解码器将特征向量解码为文字。由于当前此类研究数量太大，在这里我仅关注这其中的一类解决视觉语言任务的方法。

视觉语言模型视觉模型语言模型

1243

1

0

发布于 2022年4月29日 03:15

有限样本学习（三）：数据生成

简介: 这是有限样本学习的第三方部分内容。我们考虑两种生成训练数据的方法：数据增强与生成新数据。

有限样本学习小样本学习数据增强数据生成

974

0

0

发布于 2022年3月11日 17:16

【学术毒鸡汤】ICLR 2022 论文数据分析：你离成功只差不到一个单词

简介: 2022 年ICRL 论文结果公布，根据我爬到的数据，最终投稿的共有2658篇论文，接收1095篇论文，接收率高达41.2%。（不得不怀疑一下灌水质量）

ICLR 2022 论文数据统计学术毒鸡汤 ICLR

13461

0

0

发布于 2022年3月7日 22:34

强化学习经典算法实验之DQN

简介: DQN论文是 DeepMind 的研究人员在2013年发表的。一作作者Volodymyr Mnih博士毕业于多伦多大学，对人工智能领域特别是强化学习有杰出贡献。DQN的论文首次使用卷机神经网络直接处理游戏画面来进行Atari游戏的控制。

强化学习 DQN Atari 算法实验 openai gym

3715

0

0

发布于 2022年3月4日 18:43

有限样本学习（二）：主动学习

简介: 这是有限样本学习的第二部分内容。这次，我们允许使用有限的预算来进行人工打标签的工作。由于预算有限，我们必须非常谨慎地去选取待标记样本。

深度学习人工智能有限样本学习主动学习 Active Learning

12769

1

0

发布于 2022年2月19日 00:07

常用激活函数及其梯度可视化

简介: 本文给出了pytorch里面支持的所有二十几种激活函数的可视化作图。

机器学习人工智能神经网络可视化激活函数

6360

0

0

发布于 2021年12月23日 16:45

有限样本学习（一）：半监督学习

简介: 简介在监督学习中，高质量的标签是任务性能的保障。然而，给大量的数据样本打标签的代价是非常昂贵的。由此，机器学习中诞生了一些新的范式，专门用于解决在标签非常缺乏的情况下的学习问题。在这些范式中，半监督学习是一个可选方案（半监督学习仅需依赖很少部分打过标签的数据+大量无标签数据）。

机器学习人工智能半监督学习微调预训练

5827

0

0

发布于 2021年11月9日 23:34

对比表征学习(Contrastive Representation Learning)

简介: 对比学习(Contrastive Learning)的主要思想是让相似样本表征间的距离相近，而差别很大样本表征间的距离较远。对比学习在监督学习和非监督学习中都可以使用，在许多的计算机视觉和自然语言处理相关的任务中都有很好的性能表现。

机器学习对比表征学习对比学习表示学习

3745

0

0