You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
-
南栖仙策最新发布|强化学习工业决策软件——REVIVE 1.0
该视频由南栖仙策发布,介绍了其开发的强化学习工业决策软件 REVIVE 1.0。REVIVE 是一款数据驱动的强化学习软件,专注于工业场景中的决策任务,旨在帮助企业优化生产效率、减少错误和降低成本,推动工业向智能化和可持续方向发展。视频中还展示了南栖仙策的其他相关教程和内容,包括 REVIVE SDK 的快速入门、基于 VS Code 的开发辅助插件、下载与安装指南,以及强化学习在不同场景中的应用案例。此外,视频还提及了强化学习在工业领域的最新研究和应用进展,适合对强化学习和工业智能化感兴趣的观众。
离线强化学习算法的应用
该视频是关于离线强化学习算法的应用。视频主要介绍了离线强化学习算法的核心概念、技术进展及其在实际场景中的应用案例。通过讲解离线强化学习的特点和优势,视频帮助观众理解如何在不与环境交互的情况下,利用历史数据进行策略优化。
行业应用 | REVIVE SDK 控制系列教程—大滞后控制案例,使用数据驱动强化学习(离线强化学习)开发工具包,解决行业问题
本视频详细介绍了如何使用 REVIVE SDK 解决工业控制中的大滞后控制问题。通过数据驱动的强化学习(离线强化学习)开发工具包,视频首先讲解了大滞后控制的特性及其在工业中的挑战,接着展示了大滞后控制模拟器的工作原理、核心代码以及历史数据的采集方法。随后,视频逐步介绍了如何使用 REVIVE SDK,包括绘制决策流图、数据制作、定义专家函数、生成 yaml 和 npz 文件,并在虚拟环境中分别使用 BC 算法和 REVIVE 算法进行学习,展示了各自的分布直方图和 rollout 曲线图。此外,还定义了奖励函数并进行了策略训练,对比了 BC 算法和 REVIVE 算法在双环境中的控制效果,以及它们在真实环境中的表现。
数据驱动的强化学习及其工业应用
本报告探讨了如何将强化学习从游戏环境拓展到工业领域,以提升生产力。
仙启 | REVIVE SDK下载与安装,数据驱动强化学习(离线强化学习)开发工具包
该视频提供了南栖仙策开发的 POLIXIR REVIVE SDK 的详细下载与安装指南。REVIVE SDK 是一款数据驱动的强化学习(离线强化学习)开发工具包,能够在不需要与环境进行额外交互的情况下,从历史数据中学习最优策略。此外,视频还介绍了 REVIVE SDK 的主要功能,包括将历史数据转化为强大的决策引擎,从有限的数据中获取最大效用的策略,并快速应用于不同行业和业务场景中的多步决策任务。该工具已在智能制造、智慧物流、工业控制和用户运营等多个行业中成功验证。
仙启 | 基于VS Code的POLIXIR REVIVE SDK 开发,数据驱动强化学习(离线强化学习)开发工具包辅助插件
该视频详细介绍了基于 VS Code 的 POLIXIR REVIVE SDK 开发环境及其辅助插件的使用方法。视频首先对 REVIVE SDK 和 POLIXIR REVIVE Extension 进行了简要介绍,展示了其核心功能和应用场景。接着,视频逐步讲解了如何在 VS Code 中安装插件、注册并认证账号、检测开发环境、安装 SDK 以及快速启动训练任务。此外,还介绍了如何通过具体案例进行训练、设计决策流图、配置超参数文件、管理训练日志以及使用 TensorBoard 进行训练分析。
Beta Was this translation helpful? Give feedback.
All reactions