개인 프로젝트 - 채용 공고 추천(프로그래머스-신경망 ver)

2023. 3. 9. 23:03·My Study/Project
728x90
반응형

이전 포스팅에서 설명했던 프로젝트를 신경망을 이용해 해결해보겠습니다.

​

logistic regression문제로 접근하였습니다. 0.5가 넘으면 지원한 것으로 넘지 않으면 지원하지 않은 것으로 분류해주었습니다.

​

​

▶ Feature Engineering

Feature Engineering 단계에서 jobID만 label encoding에서 one - hot encoding으로 변경해주었습니다.

oe=OneHotEncoder(handle_unknown='ignore')
oe_result = oe.fit_transform(self.train['jobID'].values.reshape(-1, 1)).toarray()
sub=pd.DataFrame(data=oe_result, columns=oe.get_feature_names(['jobID']))
self.train=pd.concat([self.train, sub], axis=1)

oe_result = oe.transform(self.test['jobID'].values.reshape(-1, 1)).toarray()
sub=pd.DataFrame(data=oe_result, columns=oe.get_feature_names(['jobID']))
self.test=pd.concat([self.test, sub], axis=1)

그리고 jobID 열을 drop해주었습니다.

​

​

▶ 모델 설계

모델은 간단하게 2 layer로 설계했습니다.

import torch.nn as nn
import torch.nn.functional as F


class jobModel(nn.Module):
    def __init__(self, input_dim, output_dim):
        super(jobModel,self).__init__()
        self.input_dim = input_dim
        self.output_dim = output_dim
        self.fc = nn.Sequential(
            nn.Linear(self.input_dim, 1024),
            nn.Dropout(0.3),
            nn.Linear(1024, self.output_dim),
            nn.Sigmoid()
        )

    def forward(self, input):
        logits = self.fc(input)
        return logits

하이퍼 파라미터는 아래와 같이 설정해주었습니다.

batch size = 50

epochs = 200

learning rate = 1e-5

optimizer = Adam

​

​

▶Submission

test 파일에 대해 예측을 하고 제출 파일을 생성합니다.

최종 성능은 accuracy 85.42%입니다.

​random forest를 사용했을 때 보다 약 3%정도 성능이 향상되었습니다.

​

전체 코드는 저의 github 에서 확인할 수 있습니다!

728x90
반응형
저작자표시 (새창열림)

'My Study > Project' 카테고리의 다른 글

Apple Machine Learning Research 사이트  (0) 2023.09.19
개인 프로젝트 - 채용 공고 추천( 프로그래머스)  (0) 2023.03.09
광고 전환 확률 예측 모델 구현(CVR Prediction)  (0) 2023.03.09
'My Study/Project' 카테고리의 다른 글
  • Apple Machine Learning Research 사이트
  • 개인 프로젝트 - 채용 공고 추천( 프로그래머스)
  • 광고 전환 확률 예측 모델 구현(CVR Prediction)
ga.0_0.ga
ga.0_0.ga
    반응형
    250x250
  • ga.0_0.ga
    ##뚝딱뚝딱 딥러닝##
    ga.0_0.ga
  • 전체
    오늘
    어제
    • 분류 전체보기 (181)
      • Paper Review (51)
        • Video Scene Graph Generation (6)
        • Image Scene Graph Generation (18)
        • Graph Model (5)
        • Key Information Extraction (4)
        • Fake Detection (2)
        • Text to Image (1)
        • Diffusion Personalization (4)
        • etc (11)
      • AI Research (49)
        • Deep Learning (30)
        • Artificial Intelligence (15)
        • Data Analysis (4)
      • Pytorch (10)
      • ONNX (5)
      • OpenCV (2)
      • Error Note (34)
      • Linux (2)
      • Docker (3)
      • Etc (7)
      • My Study (16)
        • Algorithm (10)
        • Project (4)
        • Interview (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    tensorflow
    TypeError
    contiguous
    HRNet
    torch.nn
    forch.nn.functional
    JNI
    정규화
    linear regression
    dataloader
    활성화 함수
    pandas
    3dinput
    pytorch
    GCN
    fine tuning
    Logistic regression
    RuntimeError
    Inductive bias
    dataset
    차원의 저주
    Activation Function
    나이브 베이즈 분류
    알고리즘
    transformer
    오차 역전파
    i3d
    그래프신경망
    permute
    ONNX
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
ga.0_0.ga
개인 프로젝트 - 채용 공고 추천(프로그래머스-신경망 ver)
상단으로

티스토리툴바