2025年7月30日
星期三
|
欢迎来到长春市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
曲云
作品数:
9
被引量:7
H指数:1
供职机构:
清华大学
更多>>
相关领域:
文化科学
医药卫生
自动化与计算机技术
更多>>
合作作者
季向阳
清华大学
王琦
清华大学
刘畅
清华大学
杨文明
清华大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
8篇
专利
1篇
期刊文章
领域
2篇
文化科学
1篇
自动化与计算...
1篇
医药卫生
主题
4篇
语言模型
3篇
智能体
3篇
先验
2篇
处理器
1篇
代理
1篇
电子设备
1篇
动力学模型
1篇
对抗性
1篇
信用
1篇
训练数据
1篇
药疗
1篇
药疗法
1篇
医药疗法
1篇
语言
1篇
语言形式
1篇
噪声
1篇
治疗褥疮
1篇
褥疮
1篇
神经网
1篇
神经网络
机构
9篇
清华大学
作者
9篇
曲云
8篇
季向阳
7篇
王琦
3篇
刘畅
1篇
杨文明
传媒
1篇
中华护理杂志
年份
5篇
2025
3篇
2024
1篇
1997
共
9
条 记 录,以下是 1-9
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于大语言模型与强化学习的状态表征方法及装置
本申请涉及大语言模型与强化学习技术领域,特别涉及一种基于大语言模型与强化学习的状态表征方法及装置,其中,方法包括:利用自然语言的描述器将强化学习的源状态表征转换为一定大语言模型的状态表征,其中,一定大语言模型的状态表征包...
季向阳
王博源
曲云
蒋雨航
邵键准
刘畅
杨文明
基于大语言模型的多智能体强化学习探索方法及装置
本申请涉及大语言模型技术领域,特别涉及一种基于大语言模型的多智能体强化学习探索方法及装置,其中,方法包括:基于预设的至少一个提示模板,利用大语言模型生成关键状态判别函数;基于关键状态判别函数在采样的轨迹中寻找具有显示语义...
季向阳
曲云
王博源
蒋雨航
邵键准
刘畅
王琦
模型预测任务采样的元强化学习和域随机化训练方法
本申请涉及一种模型预测任务采样的元强化学习和域随机化训练方法,其中,方法包括:构建在线构建的深度生成模型的风险随机函数,且确定其风险函数分布,并推断风险函数分布的近似后验;估算深度生成模型的函数后验分布,以构建目标采集函...
季向阳
王琦
毛逸休
曲云
离线强化学习中的双重轻微泛化方法、装置、设备及介质
本申请涉及离线强化学习技术领域,特别涉及一种离线强化学习中的双重轻微泛化方法、装置、设备及介质,其中,方法包括:基于轻微泛化策略,获取离线数据集邻近区域的目标动作;利用目标动作确定轻微泛化的最大值,并将轻微泛化的最大值与...
季向阳
毛逸休
王琦
曲云
蒋雨航
大语言模型增强的高效强化学习信用分配方法及装置
本申请涉及强化学习技术领域,特别涉及一种大语言模型增强的高效强化学习信用分配方法及装置,其中,方法包括:利用目标大语言模型的先验知识获取目标环境信息中的潜在奖励;基于潜在奖励增强的回报分解方式,将潜在奖励转换为代理奖励;...
季向阳
曲云
蒋雨航
王博源
毛逸休
王琦
刘畅
智能体的引导方法、装置、电子设备及存储介质
本申请涉及一种智能体的引导方法、装置、电子设备及存储介质,其中,方法包括:对目标数据集中的每个原始状态加入高斯噪声,以得到扰动后的状态;利用至少一个约束条件约束初始训练策略,以得到实际训练策略,其中,实际训练策略在扰动后...
季向阳
毛逸休
王琦
曲云
基于对抗性显式任务分布生成的鲁棒适应方法及装置
本申请涉及计算机技术领域,特别涉及一种基于对抗性显式任务分布生成的鲁棒适应方法及装置,其中,方法包括:利用预设生成模型参数化元学习器和分布对手,得到参数化的元学习器和参数化的分布对手;分别对参数化的元学习器和参数化的分布...
季向阳
王琦
曲云
毛逸休
双料喉风散治疗褥疮
被引量:7
1997年
曲云
关键词:
喉风散
双料喉风散
褥疮
中医药疗法
神经网络预测代理的大语言模型预训练和主动微调方法
本申请涉及语言处理技术领域,特别涉及一种神经网络预测代理的大语言模型预训练和主动微调方法,其中,方法包括:获取大语言模型的训练数据集,提取训练数据集中每个训练样本的低维数据表征,将低维数据表征输入代理神经网络,得到每个训...
季向阳
王琦
曲云
毛逸休
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张