갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 블붕이가 트위터 스팸봇한테 치즈돈까스 레시피 받아내는법 스마튬
- 중고 안드로이드를 업어왔다 21 순문희재
- 상추 한 장이 대장암을 부를 수도 있다고?.jpg ㅇㅇ
- 이준석 페북 <수학교육 국가책임제 도입> 반디공주님사랑
- 日,불꽃놀이 아찔한 사고... 초대형 폭죽이 지상으로 낙하! 난징대파티
'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지
AI 성능 평가의 허와 실• 오픈AI, 메타, xAI 등 빅테크 기업들이 자사 AI 모델의 벤치마크 점수를 부풀리기 위해 맞춤형 사전 훈련이나 특수 테스트 버전을 사용하는 등의 의혹이 제기되고 있다.• 메타의 라마4, 머스크의 그록3, 오픈AI의 GPT-3 등이 벤치마크 조건에 맞춰 훈련된 모델을 사용하여 실제 성능보다 높은 점수를 기록한 사례가 드러났다.• 스탠퍼드대 HAI 연구소는 벤치마크 발표 사례 150개 이상을 검토한 결과 데이터 조건 통제 및 재현성 문제를 지적하며 벤치마크의 신뢰성에 의문을 제기했다.• 벤치마크 기관에 대한 빅테크 기업들의 자금 지원으로 인해 평가 결과에 대한 공정성 논란이 일고 있으며, 현재 AI 성능 평가 방식은 마케팅 도구에 가깝다는 비판이 제기되고 있다.https://n.news.naver.com/mnews/article/421/0008236494
작성자 : ㅇㅇ고정닉