Hugging Face
인간 피드백을 통한 내쉬 학습 가속화: 미러 프록스 기법을 활용하여
10일 전
Hugging Face
LLaDA 1.5: 대형 언어 확산 모델을 위한 분산 감소 선호 최적화
10일 전
Hugging Face
강제 프롬프트: 비디오 생성 모델이 물리 기반 제어 신호를 학습하고 일반화할 수 있다
10일 전
Hugging Face
바이브 코딩 vs. 에이전틱 코딩: 에이전틱 AI의 기초와 실용적 함의
10일 전
Hugging Face
WHISTRESS: 문장 강세 탐지를 통한 전사 강화
10일 전
Hugging Face
WINA: 대형 언어 모델 추론 가속화를 위한 가중치 기반 뉴런 활성화
10일 전
Hugging Face
MLR-Bench: AI 에이전트를 활용한 개방형 머신러닝 연구 평가
10일 전
Hugging Face
G1: 시각-언어 모델의 인지 및 추론 능력 부트스트래핑을 강화 학습을 통해 구현
10일 전
Hugging Face
수십 시간에서 수만 시간으로: 음성 인식을 위한 백번역 확장
10일 전
Hugging Face
메모리 효율적인 시각적 자기회귀 모델링과 스케일 인식 KV 캐시 압축
10일 전
Hugging Face
강화 학습을 통한 대형 언어 모델의 교차 추론
10일 전
Hugging Face
AdaCtrl: 적응적이고 제어 가능한 추론을 위한 난이도 인식 예산 할당
10일 전
Hugging Face
대규모 멀티모달 모델에서 세밀한 기하학적 이해를 위한 하드 네거티브 대조 학습
10일 전
Hugging Face
효율적인 추론을 위한 탐구: CoT 증류를 위한 데이터 중심 벤치마크
10일 전
Hugging Face
완벽함보다 완료가 낫다: 구조화된 다중 턴 분해를 통한 효율적인 추론의 실현
10일 전
Hugging Face
ModernGBERT: 독일어 전용 1B 인코더 모델을 처음부터 훈련
10일 전
Hugging Face
어떤 데이터 속성이 수학 및 코드 추론을 자극하는가? 영향 함수에 의한 조사
10일 전
Hugging Face
StructEval: LLM의 구조적 출력 생성 능력 평가
10일 전
Hugging Face
이산 마르코프 브리지
10일 전
Hugging Face
강화 학습 미세 조정이 멀티모달 대형 언어 모델의 추론 능력을 강화하다
10일 전
Hugging Face
Flex-Judge: 한 번 생각하고 어디서나 판단하기
10일 전
Hugging Face
외부 보상 없이 추론 학습하기
10일 전
Hugging Face
형식과 길이에서 대체 신호: 정답 없이 수학 문제를 해결하는 강화 학습
10일 전
Hugging Face
MLLMs가 나를 집으로 안내할 수 있을까? 교통 지도에서의 세밀한 시각적 추론에 대한 벤치마크 연구
10일 전
Hugging Face
MOOSE-Chem2: 계층적 검색을 통한 세밀한 과학적 가설 발견에서 LLM의 한계 탐구
10일 전
Hugging Face
언어 모델의 평생 안전 정렬
10일 전
Hugging Face
B-score: 응답 기록을 사용한 대형 언어 모델의 편향 탐지
10일 전
Hugging Face
경로 보조 LLM 추론 해독: 최적화 관점
10일 전
Hugging Face
Enigmata: 대규모 언어 모델에서 논리적 추론 확장을 위한 합성 검증 퍼즐
10일 전
Hugging Face
구체화된 에이전트와 개인화의 만남: 개인화된 도움을 위한 메모리 활용 탐구
10일 전
Hugging Face
연금술사: 공공 텍스트-이미지 데이터를 생성적 금으로 바꾸기
10일 전
Hugging Face
BizFinBench: 비즈니스 중심의 실제 금융 벤치마크를 통한 LLM 평가
10일 전
Hugging Face
AI 효율성 전환: 모델 중심에서 데이터 중심 압축으로
10일 전
Hugging Face
Mutarjim: 양방향 아랍어-영어 번역을 위한 소형 언어 모델의 발전
10일 전
Hugging Face
FuxiMT: 중국어 중심 다국어 기계 번역을 위한 대형 언어 모델 희소화
11일 전
Hugging Face
NOVER: 검증자 없는 강화 학습을 통한 언어 모델의 인센티브 훈련
11일 전
Hugging Face
FREESON: 검색기 없는 검색-증강 추론을 통한 코퍼스-트래버싱 MCTS
11일 전
Hugging Face
모든 모델이 전문가 오프로딩에 적합하지는 않다: 전문가 혼합 모델의 로컬 라우팅 일관성에 대하여
11일 전
Hugging Face
LLM 추론 증강을 위한 동적 노트 작성: 복잡한 질문 응답을 위한 접근
11일 전
Hugging Face
가치 유도 탐색을 통한 효율적인 사고의 연쇄 추론
11일 전
Hugging Face
DanceTogether! 정체성 보존 다중 인물 상호작용 비디오 생성
11일 전
Hugging Face
대형 언어 모델은 읽기만으로도 암묵적으로 보고 듣는 법을 배운다
11일 전
Hugging Face
ReflAct: 목표 상태 반영을 통한 LLM 에이전트의 세계 기반 의사 결정
11일 전
Hugging Face
KL-정규화된 정책 경사 알고리즘 설계에 관한 연구: 대형 언어 모델의 추론을 위한 접근
11일 전
Hugging Face
RePrompt: 강화 학습을 통한 텍스트-이미지 생성에서의 추론 강화 리프롬프팅
11일 전
Hugging Face
Transformer Copilot: 실수 로그에서 배우는 LLM 미세 조정
11일 전
Hugging Face
합성 데이터 RL: 작업 정의가 전부입니다
11일 전
Hugging Face
비전-언어 모델은 야생에서 안전한가요? 밈 기반 벤치마크 연구
11일 전
Hugging Face
Trinity-RFT: 대형 언어 모델의 강화 학습 미세 조정을 위한 범용 통합 프레임워크
11일 전
Hugging Face
s3: 많은 데이터를 필요로 하지 않는 검색 에이전트 훈련
11일 전
Hugging Face
RBench-V: 시각적 추론 모델의 다중 모달 출력에 대한 초기 평가
11일 전
Hugging Face
ScanBot: 지능형 표면 스캐닝을 향한 구현된 로봇 시스템
11일 전
Hugging Face
말 없는 언어 교육: 저자원 언어를 위한 음성 없는 음성 교육
11일 전
Hugging Face
대형 언어 모델에게 맥락적 충실성을 유지하는 법을 가르치는 방법: 합성 작업과 강화 학습을 통해
11일 전
Hugging Face
Time-R1: LLM에서의 포괄적인 시간 추론을 향하여
11일 전
Hugging Face
불확실성의 위치: 대형 언어 모델에서의 위치 편향에 대한 언어 간 연구
11일 전
Hugging Face
맑은 밤을 위하여: 다중 날씨 야간 이미지 복원
11일 전
Hugging Face
생각 증강 정책 최적화: 외부 지침과 내부 역량의 연결
11일 전
Hugging Face
확산 분류기는 구성 가능성을 이해하지만, 조건이 적용됩니다
11일 전
Hugging Face
FullFront: MLLM을 통한 프론트엔드 엔지니어링 워크플로우 전반 벤치마킹
11일 전
Hugging Face
Direct3D-S2: 공간 희소 주의로 기가스케일 3D 생성 쉽게 만들기
11일 전
Hugging Face
거짓말로 가르치기: 환각 탐지를 위한 합성 부정적 사례의 커리큘럼 DPO
11일 전
Hugging Face
AudioTrust: 오디오 대형 언어 모델의 다면적 신뢰성 벤치마킹
11일 전
Hugging Face
VeriThinker: 검증을 학습하여 추론 모델을 효율적으로 만드는 방법
11일 전
Hugging Face
모델은 이미 최적의 노이즈를 알고 있다: 비디오 확산 모델에서 주의 기반 베이지안 능동 노이즈 선택
11일 전
Hugging Face
MOOSE-Chem3: 실험 가이드 하이포시스 랭킹을 위한 시뮬레이션 실험 피드백
11일 전
Hugging Face
테스트 시간 진화 검색을 통한 이미지 및 비디오 생성 확장
11일 전
Hugging Face
QwenLong-CPRS: 무한대-LLMs를 향한 동적 컨텍스트 최적화
11일 전
Hugging Face
PhyX: 당신의 모델은 물리적 추론 능력을 갖추고 있나요?
11일 전
Hugging Face
LLM 에이전트를 소형 모델로 증류하기: 검색 및 코드 도구 활용
11일 전
Hugging Face
추론 모델은 고집이 세다: 추론 모델에서의 명령 무시 진단
11일 전
Hugging Face
하나의 RL로 모든 것을 보다: 시각적 트리플 통합 강화 학습
11일 전
Hugging Face
Quartet: 대형 언어 모델에 최적화된 네이티브 FP4 훈련
11일 전
Hugging Face
TabSTAR: 의미적으로 목표 인식이 가능한 기초 테이블 모델
11일 전
Hugging Face
SAKURA: 대규모 오디오-언어 모델의 다중 홉 추론에 관한 연구
12일 전
Hugging Face
공간-물리적 추론 벤치마크: 물질 분포
12일 전
Hugging Face
MuG-Eval: 다국어 생성 능력 평가 프레임워크
12일 전
Hugging Face
생성 모델을 통한 일반화 가능한 인스턴스 분할
12일 전
Hugging Face
날짜 조각: 시간적 추론을 위한 토큰화의 숨겨진 병목
12일 전
Hugging Face
언제 대형 언어 모델(LLM)은 자신의 실수를 인정할까요? 모델 신념의 역할 이해하기
12일 전
Hugging Face
RoPECraft: 훈련이 필요 없는 모션 전이 - Trajectory-Guided RoPE 최적화와 확산 변환기
12일 전
Hugging Face
RAVENEA: 다중 모달 검색 증강 시각 문화 이해를 위한 벤치마크
12일 전
Hugging Face
대규모 비전-언어 모델은 이미지 속 텍스트를 어떻게 인식할까? OCR 헤드의 독특한 역할을 밝히다
12일 전
Hugging Face
Robo2VLM: 대규모 자연 환경 로봇 조작 데이터셋을 활용한 시각적 질문 응답
12일 전
Hugging Face
안드로이드가 전기 양을 꿈꾸게 하라: 인간과 유사한 이미지 함축 이해 및 추론 프레임워크
12일 전
Hugging Face
대형 언어 모델을 활용한 기계 번역 개인화 조정
12일 전
Hugging Face
강화 학습을 통한 대형 언어 모델의 소규모 서브네트워크 미세 조정
12일 전
Hugging Face
SafeKey: 안전 추론을 위한 아하 모멘트 인사이트 증폭
12일 전
Hugging Face
형식 검증 도구를 활용한 단계별 추론 검증기 훈련
12일 전
Hugging Face
Think-RM: 생성적 보상 모델에서 장기 추론 가능하게 하기
12일 전
Hugging Face
AGENTIF: 대형 언어 모델의 에이전트 시나리오에서의 지시 따르기 벤치마킹
12일 전
Hugging Face
다중 공간 MLLM: 다중 모달 대형 언어 모델을 통한 다중 프레임 공간 이해
12일 전
Hugging Face
훈련 없이 MLLM에서의 추론과 반성
12일 전
Hugging Face
GRIT: 이미지로 생각하는 MLLM 가르치기
12일 전
Hugging Face
생각할까 말까? 비전-언어 모델을 위한 강화 학습 기반 선택적 추론
12일 전
Hugging Face
TinyV: 검증에서의 거짓 부정 감소가 LLM 추론을 위한 강화 학습을 개선하다
12일 전
Hugging Face
LaViDa: 대규모 확산 언어 모델을 통한 다중모달 이해
12일 전
Hugging Face
SpatialScore: 다중 모달 공간 이해를 위한 통합 평가
12일 전
Hugging Face
WebAgent-R1: 웹 에이전트를 위한 엔드 투 엔드 멀티 턴 강화 학습
12일 전
Hugging Face
SophiaVL-R1: MLLM의 추론을 강화하는 사고 보상
12일 전
Hugging Face
훈련 없이 효율적인 비디오 생성: 동적 토큰 조각화
12일 전
Hugging Face
외부 가이드 없이 MLLM 미세 조정에서 백도어 제거
12일 전
Hugging Face
Dimple: 병렬 디코딩을 갖춘 이산 확산 다중 모달 대형 언어 모델
12일 전
Hugging Face
성능을 저해하는 데이터를 수정하기: 강력한 정보 검색을 위한 LLM의 계단식 재레이블링
12일 전
Hugging Face
VideoGameQA-Bench: 비디오 게임 품질 보증을 위한 비전-언어 모델 평가
12일 전
Hugging Face
LLM의 과도한 사고에서 벗어나기: 셀프 브레이킹 튜닝
12일 전
Hugging Face
간극을 주의하라: 사고 도약을 연결하여 체인 오브 사고 튜닝 개선하기
12일 전
Hugging Face
AceReason-Nemotron: 강화 학습을 통한 수학 및 코드 추론 발전
12일 전
Hugging Face
일상 이미지 편집 작업에서 생성 AI의 능력 이해하기
12일 전
Hugging Face
위험 회피 강화 학습과 이타쿠라-사이토 손실
12일 전
Hugging Face
대규모 언어 확산 모델과 시각적 지시 조정
12일 전
Hugging Face
확산 변환기를 효율적으로 확장하는 방법: μP를 통해
12일 전
Hugging Face
GoT-R1: MLLM의 시각 생성 추론 능력을 강화 학습으로 해방시키기
12일 전
Hugging Face
QuickVideo: 실시간 장기 비디오 이해를 위한 시스템 알고리즘 공동 설계
12일 전
Hugging Face
픽셀 추론자: 호기심 기반 강화 학습을 통한 픽셀 공간 추론 유도
12일 전
Hugging Face
추론 확장, 통제 상실: 대규모 추론 모델에서의 지시 따르기 평가
12일 전
Hugging Face
NovelSeek: 에이전트가 과학자가 될 때 - 가설부터 검증까지의 폐쇄 루프 시스템 구축
12일 전