r's picture

r PRO

oceansweep

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

OpenRT: An Open-Source Red Teaming Framework for Multimodal LLMs

upvoted a paper 1 day ago

RedBench: A Universal Dataset for Comprehensive Red Teaming of Large Language Models

upvoted a paper 8 days ago

End-to-End Test-Time Training for Long Context

View all activity

Organizations

None yet

upvoted 2 papers 1 day ago

OpenRT: An Open-Source Red Teaming Framework for Multimodal LLMs

Paper • 2601.01592 • Published 5 days ago • 11

RedBench: A Universal Dataset for Comprehensive Red Teaming of Large Language Models

Paper • 2601.03699 • Published 2 days ago • 5

upvoted 3 papers 8 days ago

End-to-End Test-Time Training for Long Context

Paper • 2512.23675 • Published 11 days ago • 16

UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement

Paper • 2512.21185 • Published 16 days ago • 28

mHC: Manifold-Constrained Hyper-Connections

Paper • 2512.24880 • Published 9 days ago • 230

upvoted a paper 18 days ago

Are We on the Right Way to Assessing LLM-as-a-Judge?

Paper • 2512.16041 • Published 23 days ago • 32

upvoted 2 papers 24 days ago

QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

Paper • 2512.12967 • Published 26 days ago • 103

Memory in the Age of AI Agents

Paper • 2512.13564 • Published 25 days ago • 133

upvoted 3 papers about 1 month ago

In-Context Representation Hijacking

Paper • 2512.03771 • Published Dec 3, 2025 • 3

Qwen3-VL Technical Report

Paper • 2511.21631 • Published Nov 26, 2025 • 149

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

Paper • 2512.02556 • Published Dec 2, 2025 • 246

upvoted an article about 1 month ago

Article

Transformers v5: Simple model definitions powering the AI ecosystem

+2

Dec 1, 2025

•

270

upvoted a paper 2 months ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5, 2025 • 128

upvoted a collection 2 months ago

MDGA

Make Diffusion Great Again. The resource list for Super Data Learners, Quokka, and OpenMoE 2. • 16 items • Updated Nov 4, 2025 • 8

upvoted 6 papers 3 months ago

Large Language Models Do NOT Really Know What They Don't Know

Paper • 2510.09033 • Published Oct 10, 2025 • 16

BitNet Distillation

Paper • 2510.13998 • Published Oct 15, 2025 • 57

AI for Service: Proactive Assistance with AI Glasses

Paper • 2510.14359 • Published Oct 16, 2025 • 74

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA

Paper • 2510.04849 • Published Oct 6, 2025 • 114

UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG

Paper • 2510.03663 • Published Oct 4, 2025 • 15

Fine-Grained Detection of Context-Grounded Hallucinations Using LLMs

Paper • 2509.22582 • Published Sep 26, 2025 • 11