09:10 CETWednesday · May 13, 2026

shipfeed

⌘K SEARCHJK NAVO OPEN

on the wire

08:00:18arXiv — cs.AIMedHopQA benchmark tests LLM reasoning in biomedical Q&A◆08:00:18arXiv — cs.CLRouters learn geometry of sparse mixture-of-experts◆08:00:18arXiv — cs.AIStudy audits how LLMs generate political discourse during crises◆08:00:18arXiv — cs.AIClassifier Context Rot: Monitor Performance Degrades with Context◆08:00:18arXiv — cs.AIExecutable Agentic Memory for GUI Agent◆08:00:18arXiv — cs.CLLongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced◆08:00:18arXiv — cs.AISparse-to-dense rewards improve language model post-training◆08:00:18arXiv — cs.AIAI-native mobility dataset advances 6G handover and beam management◆08:00:18arXiv — cs.AIMedHopQA benchmark tests LLM reasoning in biomedical Q&A◆08:00:18arXiv — cs.CLRouters learn geometry of sparse mixture-of-experts◆08:00:18arXiv — cs.AIStudy audits how LLMs generate political discourse during crises◆08:00:18arXiv — cs.AIClassifier Context Rot: Monitor Performance Degrades with Context◆08:00:18arXiv — cs.AIExecutable Agentic Memory for GUI Agent◆08:00:18arXiv — cs.CLLongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced◆08:00:18arXiv — cs.AISparse-to-dense rewards improve language model post-training◆08:00:18arXiv — cs.AIAI-native mobility dataset advances 6G handover and beam management◆

home/sources/arxiv-cs-ai

§ source

arXiv — cs.AI

https://arxiv.org/list/cs.AI/recent·spec·393 items·last fetched 08:01:33

ad slot opena single understated line lives here — sponsor wordmark + a short line.advertise on shipfeed →

items50 latest

▶ ai·19:59

AlphaGRPO: Unlocking Self-Reflective Multimodal Generation in UMMs via Decompositional Verifiable Reward

arXiv — cs.AI

▶ ai·19:58

Learning, Fast and Slow: Towards LLMs That Adapt Continually

arXiv — cs.AI

▶ ai·19:57

Beyond GRPO and On-Policy Distillation: An Empirical Sparse-to-Dense Reward Principle for Language-Model Post-Training

arXiv — cs.AI

▶ ai·19:57

ToolCUA: Towards Optimal GUI-Tool Path Orchestration for Computer Use Agents

arXiv — cs.AI

▶ ai·19:56

OmniNFT: Modality-wise Omni Diffusion Reinforcement for Joint Audio-Video Generation

arXiv — cs.AI

▶ ai·19:54

Reward Hacking in Rubric-Based Reinforcement Learning

arXiv — cs.AI

▶ ai·19:53

KV-Fold: One-Step KV-Cache Recurrence for Long-Context Inference

arXiv — cs.AI

▶ ai·19:51

Solve the Loop: Attractor Models for Language and Reasoning

arXiv — cs.AI

▶ ai·19:48

Towards Affordable Energy: A Gymnasium Environment for Electric Utility Demand-Response Programs

arXiv — cs.AI

▶ ai·19:43

Enabling AI-Native Mobility in 6G: A Real-World Dataset for Handover, Beam Management, and Timing Advance

arXiv — cs.AI

▶ ai·19:42

The Algorithmic Caricature: Auditing LLM-Generated Political Discourse Across Crisis Events

arXiv — cs.AI

▶ ai·19:34

A Causal Language Modeling Detour Improves Encoder Continued Pretraining

arXiv — cs.AI

▶ ai·19:32

CAAFC: Chronological Actionable Automated Fact-Checker for misinformation / non-factual hallucination detection and correction

arXiv — cs.AI

▶ ai·19:15

Formalize, Don't Optimize: The Heuristic Trap in LLM-Generated Combinatorial Solvers

arXiv — cs.AI

▶ ai·19:09

Stories in Space: In-Context Learning Trajectories in Conceptual Belief Space

arXiv — cs.AI

▶ ai·19:09

Predicting Decisions of AI Agents from Limited Interaction through Text-Tabular Modeling

arXiv — cs.AI

▶ ai·19:03

Semantic Reward Collapse and the Preservation of Epistemic Integrity in Adaptive AI Systems

arXiv — cs.AI

▶ ai·19:00

OGLS-SD: On-Policy Self-Distillation with Outcome-Guided Logit Steering for LLM Reasoning

arXiv — cs.AI

▶ ai·18:57

Detecting overfitting in Neural Networks during long-horizon grokking using Random Matrix Theory

arXiv — cs.AI

▶ ai·18:52

SEMIR: Semantic Minor-Induced Representation Learning on Graphs for Visual Segmentation

arXiv — cs.AI

▶ ai·18:47

Scalable Token-Level Hallucination Detection in Large Language Models

arXiv — cs.AI

▶ ai·18:44

Trust the Batch, On- or Off-Policy: Adaptive Policy Optimization for RL Post-Training

arXiv — cs.AI

▶ ai·18:44

Discrete Flow Matching for Offline-to-Online Reinforcement Learning

arXiv — cs.AI

▶ ai·18:42

ProfiliTable: Profiling-Driven Tabular Data Processing via Agentic Workflows

arXiv — cs.AI

▶ ai·18:41

Agent-Based Post-Hoc Correction of Agricultural Yield Forecasts

arXiv — cs.AI

▶ ai·18:41

Fill the GAP: A Granular Alignment Paradigm for Visual Reasoning in Multimodal Large Language Models

arXiv — cs.AI

▶ ai·18:34

Classifier Context Rot: Monitor Performance Degrades with Context Length

arXiv — cs.AI

▶ ai·18:34

QAP-Router: Tackling Qubit Routing as Dynamic Quadratic Assignment with Reinforcement Learning

arXiv — cs.AI

▶ ai·18:32

A Family of Quaternion-Valued Differential Evolution Algorithms for Numerical Function Optimization

arXiv — cs.AI

▶ ai·18:32

MedHopQA: A Disease-Centered Multi-Hop Reasoning Benchmark and Evaluation Framework for LLM-Based Biomedical Question Answering

arXiv — cs.AI

▶ ai·18:31

$δ$-mem: Efficient Online Memory for Large Language Models

arXiv — cs.AI

▶ ai·18:25

A New Technique for AI Explainability using Feature Association Map

arXiv — cs.AI

▶ ai·18:19

BSO: Safety Alignment Is Density Ratio Matching

arXiv — cs.AI

▶ ai·18:19

Manifold Sampling via Entropy Maximization

arXiv — cs.AI

▶ ai·18:17

EHR-RAGp: Retrieval-Augmented Prototype-Guided Foundation Model for Electronic Health Records

arXiv — cs.AI

▶ ai·18:16

Reinforcing VLAs in Task-Agnostic World Models

arXiv — cs.AI

▶ ai·18:15

Towards Automated Air Traffic Safety Assessment Around Non-Towered Airports Using Large Language Models

arXiv — cs.AI

▶ ai·18:04

LISA: Cognitive Arbitration for Signal-Free Autonomous Intersection Management

arXiv — cs.AI

▶ ai·17:58

Transferable Delay-Aware Reinforcement Learning via Implicit Causal Graph Modeling

arXiv — cs.AI

▶ ai·17:55

KAN-CL: Per-Knot Importance Regularization for Continual Learning with Kolmogorov-Arnold Networks

arXiv — cs.AI

▶ ai·17:48

Executable Agentic Memory for GUI Agent

arXiv — cs.AI

▶ ai·17:47

PriorZero: Bridging Language Priors and World Models for Decision Making

arXiv — cs.AI

▶ ai·17:44

TokenRatio: Principled Token-Level Preference Optimization via Ratio Matching

arXiv — cs.AI

▶ ai·17:44

Set-Aggregated Genome Embeddings for Microbiome Abundance Prediction

arXiv — cs.AI

▶ ai·17:39

Iterative Audit Convergence in LLM-Managed Multi-Agent Systems: A Case Study in Prompt Engineering Quality Assurance

arXiv — cs.AI

▶ ai·17:37

NARA: Anchor-Conditioned Relation-Aware Contextualization of Heterogeneous Geoentities

arXiv — cs.AI

▶ ai·17:29

How Useful Is Cross-Domain Generalization for Training LLM Monitors?

arXiv — cs.AI

▶ ai·17:28

Reconnecting Fragmented Citation Networks with Semantic Augmentation

arXiv — cs.AI

▶ ai·17:28

Missingness-MDPs: Bridging the Theory of Missing Data and POMDPs

arXiv — cs.AI

▶ ai·17:24

Why Conclusions Diverge from the Same Observations: Formalizing World-Model Non-Identifiability via an Inference

arXiv — cs.AI

arXiv — cs.AI · shipfeed