디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

헌재게시판 여론 탄핵 반대: 1997, 탄핵 찬성: 82앱에서 작성

야갤러(106.102) 2024.12.19 18:59:24
조회 50 추천 0 댓글 0

import requests

from bs4 import BeautifulSoup

import transformers

import torch

from transformers import BertTokenizer, BertForSequenceClassification, Trainer, TrainingArguments

from datasets import Dataset


train_data = {

'text': [

"탄핵반대 ! 생중계 찬성", "탄핵 결사 반대!!!!", "대통령 탄핵반대 재판 생중계 요청",

"탄핵 반대 생중계하라", "생중계", "탄핵 반대 탄핵찬성하는놈들 CIA 신고하자. 미국 못 간다.",

"윤석열대통령 탄핵반대", "간첩때려잡자", "탄핵 반대 내란죄는 국정을 마비시킨 민주당이다",

"존경하는 6인 재판관님 선거조작 선관위수사를 막지 마세요[탄핵기각]생중계촉구", "탄핵무효",

"존경하는 재판관님 탄핵찬성입니다", "탄핵 찬성입니다", "찬성합니다", "탄핵 찬성합니다.",

"내란수/괴 독재자 사형 탄핵!!!!!!!", "토종한국인은 윤정은의 탄핵 찬성"

],

'labels': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1]

}


# Prepare the dataset

train_dataset = Dataset.from_dict(train_data)


# Load pre-trained KoBERT model and tokenizer

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') # Check if GPU is available

tokenizer = BertTokenizer.from_pretrained('kykim/bert-kor-base')

model = BertForSequenceClassification.from_pretrained('kykim/bert-kor-base', num_labels=2).to(device) # Move model to GPU


# Tokenize the dataset

def tokenize_function(examples):

return tokenizer(examples['text'], padding='max_length', truncation=True)


train_dataset = train_dataset.map(tokenize_function, batched=True)


# Training arguments

training_args = TrainingArguments(

output_dir='./results',

num_train_epochs=3,

per_device_train_batch_size=8,

evaluation_strategy="no",

logging_dir='./logs',

logging_steps=10,

)


# Trainer setup

trainer = Trainer(

model=model,

args=training_args,

train_dataset=train_dataset,

)


# Fine-tuning the model

trainer.train()


# Base URL for the site


anti_count = 0

pro_count = 0

# Initialize a list to store the last 10 titles

recent_titles = []


# Example function for classification

def classify_title(title):

inputs = tokenizer(title, return_tensors="pt", truncation=True, padding=True, max_length=128).to(device) # Move inputs to GPU

with torch.no_grad():

outputs = model(**inputs)

prediction = torch.argmax(outputs.logits, dim=-1).item()

return "찬성" if prediction == 1 else "반대"


# Loop through the first 1000 pages

for page in range(1, 1001):

if (page % 10) == 0:

print(f"{page}페이지까지 분석 | 탄핵 반대: {anti_count}, 탄핵 찬성: {pro_count}")

url = base_url.format(page)

response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')


# Find all rows containing title

rows = soup.select('table tbody tr')


# Extract and count titles

for row in rows:

title = row.select_one('td:nth-child(2)').text.strip()


# Skip the title if it matches any of the last 10 titles

if title in recent_titles:

# print("중복된 title 무시")

continue

# Add the current title to the list of recent titles

recent_titles.append(title)

if len(recent_titles) > 10:

recent_titles.pop(0) # Remove the oldest title if we have more than 10


label = classify_title(title)

if label == "반대":

anti_count += 1

elif label == "찬성":

pro_count += 1


print(f"탄핵 반대: {anti_count}, 탄핵 찬성: {pro_count}")

​실명 인증 든든하다 ㅋㅋㅋㅋ

- dc official App

추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 여론 선동에 잘 휘둘릴 것 같은 스타는? 운영자 24/12/16 - -
16012538 재이야 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ(223.39) 12.19 38 1
16012537 20대후반서점여직원분 ㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 49 0
16012536 아이사밖에안보여잉 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.107) 12.19 13 0
16012535 버블이나 불러라 이기 ㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 28 0
16012534 아이사 벅지 보소 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(221.152) 12.19 49 0
16012533 제보계속받노 십 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 37 0
16012532 아이사 야벅지 아흐 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.41) 12.19 17 0
16012530 니네 뭐 보냐? ㅇㅇ갤로그로 이동합니다. 12.19 44 0
16012528 좌빨 끄지라 ㅇㅇ(112.184) 12.19 15 0
16012527 야벅지에 좆비비고싶네. ㅇㅇ갤로그로 이동합니다. 12.19 42 0
16012526 재아가야 ㅋㅋㅋㅋ 빼뱀뺌빼배뱀갤로그로 이동합니다. 12.19 9 0
16012525 안중근우승 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 22 0
16012523 방송이 우습냐 왜 사적 원티드를 방송으로함 ㅇㅇ(210.223) 12.19 14 0
16012524 세은이 피부 미쳣노 ㅇㅇ갤로그로 이동합니다. 12.19 37 0
16012522 시은ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.41) 12.19 11 0
16012521 아이사 존나 섹시하지 않냐????? ㅇㅇ(211.62) 12.19 51 1
16012518 말대가리 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.107) 12.19 14 0
16012516 제보부탁 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 30 0
16012515 재이재이야 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.41) 12.19 11 0
16012513 세은아ㅋㅋㅋㅋ ㅇㅇ(211.245) 12.19 11 0
16012512 20대후반 ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 33 0
16012510 애국 아이돌 갓테이씨 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 야갤러(220.79) 12.19 11 0
16012509 아이사랑해 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.107) 12.19 13 0
16012508 아이사 야벅지 원툴이라 좌빨이었농 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(221.152) 12.19 33 0
16012507 못찾은거냐 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 22 0
16012506 아이사야 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.41) 12.19 15 0
16012505 이사님 ㅋㅋㅋ 빼뱀뺌빼배뱀갤로그로 이동합니다. 12.19 16 0
16012504 제보주세요 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 30 0
16012503 코성주 ㅇㅇ(180.66) 12.19 12 0
16012502 인사할수잇는기회를 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 25 0
16012501 망테이씨ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(124.5) 12.19 10 0
16012498 짭파트ㅋㅋ ㅇㅇ(182.222) 12.19 8 0
16012497 좌테이씨 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 야갤러(220.79) 12.19 8 0
16012496 좌빨년들 ㅇㅇ(39.7) 12.19 10 0
16012495 좌테이씨 재입갤 ㅇㅇ(122.35) 12.19 10 0
16012494 응 그사람 결혼했을 거야 찾지마 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(61.77) 12.19 21 0
16012493 야숙자에게 당신들의천국주신분ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 20 0
16012492 망피티 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.41) 12.19 9 0
16012491 지피티 ㅋㅋㅋㅋ ㄲ 빼뱀뺌빼배뱀갤로그로 이동합니다. 12.19 7 0
16012490 GPTㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 호컬지갤로그로 이동합니다. 12.19 11 0
16012489 아이사와무수리들 가보자 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.107) 12.19 12 0
16012488 야테이씨 입갤 ㅋㅋㅋ 빼뱀뺌빼배뱀갤로그로 이동합니다. 12.19 10 0
16012487 기억을못합니다 ㅋㅋㅋㅋㅋㅌㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 22 0
16012486 세상에이런일이 그 많던 패널들 어디감 ㅇㅇ(210.223) 12.19 13 0
16012485 탄핵돌 좌테이씨 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(221.152) 12.19 27 0
16012484 야테이씨 대기 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.41) 12.19 12 0
16012483 예은아씨 슴골 너무미치겠음 ㅇㅇ(211.245) 12.19 19 0
16012482 마지막 편지 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 12.19 29 0
16012481 몇 연 잦돌이노 ㅋㅋㅋㅋ 빼뱀뺌빼배뱀갤로그로 이동합니다. 12.19 14 0
16012480 아오 또잦돌 ㅆㅂ ㅇㅇ(211.107) 12.19 13 0
뉴스 [포토] 이영현, 정규 3집 '프라이빗'으로 돌아왔어요 디시트렌드 12.19
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2