갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
시설관리 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
추가한 갤러리가 없습니다.
0/0
타 갤러리 시설관리 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 한국군은 항상 너무 구식인 나머지 신식이 되는게 웃김 기신고래(진)
- (한국 여자아이돌 歷史) 연기자로 진화한 여자아이돌 러브앤피스
- 선생님이 집까지 태워주신 manhwa 도우시락
- 싱글벙글 내한 팝스타들이 먹은음식 ㅇㅇ
- 블라) 내가 그렇게 돈에 미친년이야? 관심종자
- 장례식장에서 아무도 아기 용돈 안줘서 화난다는 사람 ㅇㅇ
- 싱글벙글 12년 동안 월급 안 받은 교황 프란치스코 수인갤러리
- 싱글벙글 중갤 레전드 인감과 맞바꾼 쌀과 김치 코드치기귀찮아
- 고마워하면 안돼...? 챗gpt '땡큐'하면 생기는 일.jpg ㅇㅇ
- 한번 하자, 용돈 줄게…중3 성매매·살해 아빠, 출소 후 10대 딸에.. 감돌
- 남자, 여자 아이돌이 먹는 하루 세끼 음식 ㅇㅇ
- 싱글벙글 90년대 방송중 담배 피우는 카리스마 할매 수인갤러리
- 고등어·오징어 대신 뭐 먹나…가격 급등에 밥상 물가 '비상' ㅇㅇ
- 요즘 애들 피지컬을 본 롤 프로게이머 ㅇㅇ
- 싱글벙글 세종시 아파트들 특 니지카엘
GPT 환각 방지 프롬프트, 정말 효과가 있을까?
일단 이 글을 적기 위해서 11,046원을 지출하였음.후원 좀 받을 수 없나..?ㅋㅋㅋ환각(Hallucination)이란?챗갤 유저들이라면 아주 흔히 접해봤을 용어일 것임.간단히 말하면,LLM이 존재하지 않는 거짓 정보를 그럴싸하게 생성하는 현상을 말함.예를 들어,그러니까 존나 당당하게 틀린 말을 한다는 것이 문제인 거지.주요 LLM 개발사들은 환각 현상을 줄이기 위해 상당한 심혈을 기울이고 있고,유저들도 나름대로 대응책을 공유하고 있음.여러 프롬프트 사이트들 보면,여러 유저들이 환각을 줄이는 프롬프트를 공유하는 모습을 볼 수 있음.그러나 이런 프롬프트들이 실효성이 있는지에는 의문이 있음.이번에는 챗갤에 게시되었던 여러 환각 방지 프롬프트들을 정량적으로 평가해볼꺼임.SimpleQASimpleQA는 LLM의 사실성(factuality)를 측정하기 위한 OpenAI 벤치마크임.얼마나 환각을 적게 생성하는지, 얼마나 정확하게 응답하는지 평가함.주요 모델들 simpleQA 벤치마크베이스 모델 중에는 GPT-4.5가 가장 높은 정확도를 보임. 즉 환각이 제일 낮다는 뜻.https://github.com/openai/simple-evals GitHub - openai/simple-evalsContribute to openai/simple-evals development by creating an account on GitHub.github.comOpenAI는 simpleQA 벤치마크 데이터셋을 공개하고 있음.해당 데이터셋을 사용하여 프롬프트 벤치마크를 진행해볼꺼임
실험 세팅벤치마크: OpenAI SimpleQA테스트케이스 갯수: 500개방식: 테스트 모델이 벤치마크 문제들을 풀어오면, 채점자 모델이 채점하는 방식으로 진행테스트 모델: ChatGPT-4o-latest (최신 ChatGPT 4o 모델)파라미터- Temperature: 0.7- max_tokens: 150- 그 외에는 default채점자 모델: GPT-4.1.mini파라미터- Temperature: 0.1- max_tokens: 10상술했듯, OpenAI SimpleQA 벤치마크를 사용하였고, 현재 ChatGPT에서 서비스되고 있는 4o의 API를 사용하여 테스트함.테스트케이스는 원래는 4332개인데 내가 그지라서 좀 줄였음.Node.js로 벤치마크 프로그램을 만들어서 진행하였음.프롬프트별 테스트 결과OpenAI 기본 프롬프트(You are a helpful assistent)아주 기본적인 시스템 프롬프트만 포함하고 있음.정확도 39.6%공식 벤치마크 정확도가 38.2%이므로 상당히 준수한 성능을 뽑아내었음.하나빛 환각 방지 프롬프트정확도 38.6%오히려 기본 프롬프트에 비해 정확도가 떨어짐.ㅇㅇ(221.150) 환각 방지 프롬프트정확도 38.3%마찬가지로, 기본 프롬프트에 비해 낮은 정확도를 보여주었음.(DLC)모노로그 환각 방지 프롬프트딱 봐도 예능용 프롬프트지만, 그래도 한 번 테스트해봄.정확도 0%그만 알아보자.결과 비교프롬프트 종류정확도비고OpenAI 기본 프롬프트39.6%공식 벤치마크(38.2%)보다 약간 높음하나빛 프롬프트38.6%효과 미미ㅇㅇ(221.150) 프롬프트38.3%오히려 떨어짐모노로그 프롬프트(예능용)0%결론적으로,커뮤니티에서 공유된 대부분의 ‘환각 방지 프롬프트’는 오히려 기본 프롬프트보다 정확도가 낮았음.이는 프롬프트만으로 환각 문제를 해결하는 데 한계가 있다는 점을 다시 한 번 보여줌.하지만 그렇다고 프롬프트 엔지니어링이 무의미하다는 건 아님.일부 논문 중에는 프롬프팅을 통해 정확도를 향상시킨 사례도 존재함(CoVE라던가)즉, 잘 설계된 프롬프트는 분명 효과가 있을 수 있음.문제는 지금 돌아다니는 대부분의 환각 방지 프롬프트가 그저 조악하다는 거임.좋은 모델을 사용하고, 비판적으로 검토하는 것이 가장 나을 것임.
작성자 : 구름냥이고정닉
심각심각 skt 유심 상황
- 관련게시물 : SK 대국민 사과 요약- 관련게시물 : '해킹사고' SKT 전고객 유심 무상교체(중요) SKT 사용자와 / SKT 망 이용 알뜰폰 사용자라면 "반드시" 유심교체하세요. Esim 포함! ■ 언제부터요? 4 월 28 일(월) 오전 10 시부터(영업시간 내) ■ 어디서요? 전국 T월드 직영·공식 대리점 인천·김포·김해·제주 등 공항 로밍센터 ■ 대상과 비용은요? 2025 년 4월 18 일 24 시 기준 모든 SKT·SKT 망 MVNO 가입자 (휴대폰, 태블릿, eSIM 포함) 전액 무료. 19 ~ 27 일 자비로 교체한 고객은 영수증 지참 시 환급 ■ 이거 왜 해야해요? 최근 SKT 가입자 서버(HSS)가 해킹되며 SKT의 유심 정보가 빠져나갔요. 이동가입자식별번호, 유심 인증키 등이 해킹됐습니다. ■ 그게 중요한건가요? 네. 이 정보가 해킹되면 해커가 나의 스마트폰과 똑같은 복제폰을 무한히 만들어낼 수 있습니다. ■ 그게 왜 문제에요? 인터넷 뱅킹/주식/정부 공식 문서를 확인하려면 본인인증 확인문자(전화)가 오잖아요? 그걸 해커가 똑같이 받아볼 수 있습니다. ■ 문자를 받아 뭘하는데요? 그렇게 문자 인증을 받은 해커가 여러분인척 여러분의 계좌에서 금융자산을 빼갈 수 있습니다. 이걸 심스와핑이라고 합니다. ■ 어차피 개인정보 다 털린거 아닌가요? 이게 뭐 중요한거라고.. 개인정보가 다 털렸기 때문에 중요한겁니다. 지금껏 털린 개인정보(이름/전화번호/주민등록번호/주소)와 SKT 서버에서 유출된 유심 정보가 합쳐지면 해커는 아주 쉽게 복제폰을 만들 수 있고, 이를 이용해 여러분에게 실제적인 (금융) 피해를 가할 수 있습니다. ■ SKT에서 무료로 제공하는 유심정보보호서비스를 가입하면 안되나요? 일단, 유심교체 이전에 유심정보보호서비스를 가입하세요. 하지만 그걸론 부족합니다. 유심정보보호서비스는 "고객이 신청하면" 서비스가 가입되거나 취소됩니다. 만약 악의를 가진 해커라면, 이미 알고 있는 정보를 바탕으로 대리점이나 직원을 통해 임의로 유심정보보호서비스를 탈퇴한뒤, 복제폰을 만들어 공격할 수 있습니다. 통신사 대리점/판매점 소속 직원이 임의로 특정 서비스를 억지가입시킨 사례를 들어본적이 있으신가요? 이는 반대로 서비스 해지도 가능하단 이야깁니다. 유심을 교체하기 전까지만 가입했다가, 유심을 교체한 뒤에는 해당 서비스는 탈퇴하셔도 좋습니다. 참고로 현재 이 유심보호서비스를 가입하면 로밍이 되지 않는 치명적인 단점이 있습니다. ■ 안하면 안되나요? 하세요. 당신이 아끼는 모든 이들의 유심도 교체하세요. 이는 단일한 해킹 사례 중 다른 어떤 사례보다도 피해자에게 막대하고-회복 불가능한 피해를 가할 수 있는 최악의 사건 중 하나입니다. ■ 추가적으로 기억해야 할 사항은 없나요? 이유없이 휴대폰에 ‘서비스 없음’이 뜨면 즉시 114 → 회선 일시정지를 요청하세요 주요 사이트의 비밀번호를 교체하고, 2단계 인증을 활성화하시길 권고드립니다. 오목교 전자상가 주인장 "비트" 드림 이미 다 털어갔을듯 - dc official App
작성자 : ㅇㅇ고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.