AI Sec Watch: A Security Intelligence Platform for AI Systems

Luu, T.J.

Model-Based Offline Reinforcement Learning With Adversarial Data Augmentation

inforesearchPeer-Reviewed

research

Source: IEEE Xplore (Security & AI Journals)December 2, 2025

Summary

Model-based offline reinforcement learning (RL, where an AI learns to make decisions from a fixed dataset without interacting with a live environment) struggles because static data makes it hard to develop robust policies. This paper introduces MORAL, which uses adversarial data augmentation (a technique where competing AI models deliberately generate challenging training examples to improve robustness) to dynamically enrich training data and improve policy learning instead of using traditional fixed rollout methods.

Classification

Attack SophisticationModerate

AI Component TargetedTraining Data

Monthly digest — independent AI security research

Original source: http://ieeexplore.ieee.org/document/11271829

First tracked: June 8, 2026 at 02:01 AM

Classified by LLM (prompt v3) · confidence: 85%