향수, 화장품 갤러리 - 커뮤니티 포털 디시인사이드

통합검색 바로가기 본문영역 바로가기 페이지 하단 게시물 리스트 바로가기 페이지 하단 로그인영역 바로가기

야간 모드를 이용해 보세요

향수, 화장품 갤러리

1/3

'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지 AI 성능 평가의 허와 실• 오픈AI, 메타, xAI 등 빅테크 기업들이 자사 AI 모델의 벤치마크 점수를 부풀리기 위해 맞춤형 사전 훈련이나 특수 테스트 버전을 사용하는 등의 의혹이 제기되고 있다.• 메타의 라마4, 머스크의 그록3, 오픈AI의 GPT-3 등이 벤치마크 조건에 맞춰 훈련된 모델을 사용하여 실제 성능보다 높은 점수를 기록한 사례가 드러났다.• 스탠퍼드대 HAI 연구소는 벤치마크 발표 사례 150개 이상을 검토한 결과 데이터 조건 통제 및 재현성 문제를 지적하며 벤치마크의 신뢰성에 의문을 제기했다.• 벤치마크 기관에 대한 빅테크 기업들의 자금 지원으로 인해 평가 결과에 대한 공정성 논란이 일고 있으며, 현재 AI 성능 평가 방식은 마케팅 도구에 가깝다는 비판이 제기되고 있다.https://n.news.naver.com/mnews/article/421/0008236494 작성자 : ㅇㅇ

글쓰기

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	실제 모습일지 궁금한 미담 제조기 스타는?	운영자	25/05/05	-	-
공지	갤러리 댓글 기능 개선(멘션 기능) 안내	운영자	25/05/08	-	-

처음 이전 18466 18467 18468 18469 184701847118472 18473 18474 18475 18476 18477 18478 18479 18480 다음 끝

로그인해 주세요.

MY갤로그 즐겨찾기 알림

실시간 베스트

1/8

중고 안드로이드를 업어왔다 21

공공체육시설 점령한 동호회…“회비 내라” 배짱

구글, 21년간 숨긴 세금 최대 17조?… 민병덕, 디지털세 필요

민주당 "이재명 당선돼도 무죄 선고할 재판은 계속해도 된다"

“경제 전망 불확실성 ‘더’ 커졌다”...美연준 3연속 기준금리

'조희대 발' 전국법관대표회의 개최 여부 오늘 결론

권영세 "단일화 안 될 경우 김문수로...저는 사퇴"

수염을 기르다. 그리고 적~ 사족

싱글벙글 실제 늑대언냐 크기 체감 사이즈

김문수 - 한덕수 단일화 협상 결렬

이준석 페북 <수학교육 국가책임제 도입>

훌쩍훌쩍... 남자랑 살면 삶의질 떨어진다는 여자들

안철수 "이재명, 후보직 내려놓고 남은 재판에 성실히 임하라"

블붕이가 트위터 스팸봇한테 치즈돈까스 레시피 받아내는법

싱글벙글 ??? : 그게 뭔데 씹덕아 ㅋㅋ

'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지

뉴스

디시미디어

디시이슈

1/2

‘이혼숙려캠프’ 측, 진태현 갑상선암 투병에 “출연진 변동無…쾌유 기원” [공식]

“중2 때 성관계” 김수현, 김새론 녹취 진실 공방 “AI 조작”

[TVis] 박수홍, 딸 재이 진로 확신…“제니와 코첼라 가야겠다” (슈돌)

[TVis] 제니 “속 시원했던 코첼라, 내 영상 계속 보게 돼” (유퀴즈)

개념글[리그 오브 레전드]

1/21