🏭 다이캐스팅 불량 예측 모델 — 작업 로그📅 작성일: 2026-03-03🔖 오늘 작업: EDA · 변수/피처 정의📋 목차데이터 기본 현황중복 데이터 처리이상치 처리 — High_Velocity == 0파생 변수 생성클래스 불균형 확인중복 제거 전후 불량률 비교다음 단계1. 📊 데이터 기본 현황 항목 값 전체 데이터 건수7,535건양품5,842건 (77.6%)불량1,689건 (22.4%)제품 타입Product_Type 1 / 2 (별도 분석 예정)2. 🔍 중복 데이터 처리중복 현황 중복 기준 건수 전체 행 기준 중복0건ID 기준 중복0건ID 제외 행 중복2,918건 (x 2 = 5,836건)단일 기록1,699건원인 파악Shot 1번당 Cavity 1, 2의 불량 데이터가 모두 기록되는 구조..
SQL 코드카타Q165. Population Census1. 문제 링크: https://www.hackerrank.com/challenges/asian-population/problem2. 정답 코드:SELECT SUM(c.Population)FROM CITY as cJOIN COUNTRY as co ON c.CountryCode = co.CodeWHERE co.Continent = 'Asia'Python 코드카타 (https://github.com/heeso0908/codekata.git)Q55. 카드 뭉치1. 문제 링크: https://school.programmers.co.kr/learn/courses/30/lessons/1599942. 정답 코드:def solution(cards1, cards2..
라이브 세션) 머신러닝 실습 7일차: 회귀1) 배깅(Bagging) - 병렬적여러 개의 서로 다른 모델을 만들고 평균을 내면 분산이 줄어든다(=일반화가 잘된다)원본 데이터에서 복원추출(Bootstrap)로 여러 데이터셋 생성각각 독립적으로 모델 학습결과를 평균(회귀) 또는 다수결(분류)대표적으로는 Random Forest2) 부스팅(Boosting) - 순차적 ★양보다 질★이전 모델의 오차를 다음 모델이 보완한다첫 모델 생성오차 계산오차를 예측하는 모델 생성반복대표적으로는 XGB, Light GBM, Cat Boost💡각 앙상블 모델은 어떨 때 사용?Random Forest: 빠르고 간단하고 성능 무난XGB: 최고 성능을 목표로 할 때Light GBM: 대용량 데이터Catboost: 범주형 컬럼이 많을..
SQL 코드카타Q161. Weather Observation Station 161. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-16/problem2. 정답 코드:SELECT ROUND(MIN(LAT_N), 4)FROM STATIONWHERE LAT_N > 38.7780; Q162. Weather Observation Station 171. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-17/problem2. 정답 코드:SELECT ROUND(LONG_W, 4)FROM STATIONWHERE LAT_N > 38.7780ORDER BY L..
SQL 코드카타Q159. Weather Observation Station 141. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-14/problem2. 정답 코드:SELECT ROUND(MAX(LAT_N), 4)FROM STATIONWHERE LAT_N Q160. Weather Observation Station 151. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-15/problem2. 정답 코드:SELECT ROUND(LONG_W, 4)FROM STATIONWHERE LAT_N = (SELECT MAX(LAT_N) FROM STA..
SQL 코드카타Q157. Top Earners1. 문제 링크: https://www.hackerrank.com/challenges/earnings-of-employees/problem2. 정답 코드:SELECT (months * salary) as total, COUNT(*)FROM EmployeeWHERE (months * salary) = (SELECT MAX(months * salary) FROM Employee)GROUP BY total;집계 함수가 아닌 (months * salary) 컬럼은 GROUP BY로 묶어주기!WHERE 절에서 monthe * salary는 2개 컬럼을 연결한 값이기 때문에 비교할 때 괄호로 적어주기 Q158. Weather Observation Station..
SQL 코드카타Q156. The Blunder1. 문제 링크: https://www.hackerrank.com/challenges/the-blunder/problem2. 정답 코드:SELECT CEIL(AVG(e.Salary) - AVG(z.Salary_zero_x))FROM EMPLOYEES as eJOIN (SELECT REPLACE(Salary, 0, '') as Salary_zero_x FROM EMPLOYEES) as zCEIL 함수로 올림 처리0을 ''으로 REPLACE 하여 원하는 컬럼(Salary_zero_x) 만들어서 계산 Q169. New Companies1. 문제 링크: https://www.hackerrank.com/challenges/the-company/problem2. 정..
SQL 코드카타Q144. Weather Observation Station 121. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-12/problem2. 정답 코드:SELECT DISTINCT CITYFROM STATIONWHERE LEFT(CITY, 1) NOT IN ('a', 'e', 'i', 'o', 'u') AND RIGHT(CITY, 1) NOT IN ('a', 'e', 'i', 'o', 'u'); Q145. Higher Than 75 Marks1. 문제 링크: https://www.hackerrank.com/challenges/more-than-75-marks/problem2. 정답 코드:SELECT Name..
SQL 코드카타Q142. Weather Observation Station 101. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-10/problem2. 정답 코드:SELECT DISTINCT CITYFROM STATIONWHERE RIGHT(CITY, 1) NOT IN ('a', 'e', 'i', 'o', 'u'); Q143. Weather Observation Station 111. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-11/problem2. 정답 코드:SELECT DISTINCT CITYFROM STATIONWHERE (LE..
SQL 코드카타Q140. Weather Observation Station 81. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-8/problem2. 정답 코드:SELECT DISTINCT CITYFROM STATIONWHERE (LEFT(CITY, 1) = 'a' OR LEFT(CITY, 1) ='e' OR LEFT(CITY, 1) ='i' OR LEFT(CITY, 1) ='o' OR LEFT(CITY, 1) ='u') AND (RIGHT(CITY, 1) = 'a' OR RIGHT(CITY, 1) ='e' OR RIGHT(CITY, 1) ='i' OR RIGHT(CITY, 1) ='o' OR RIGHT(CITY, 1)..
- Total
- Today
- Yesterday
- 코딩기초
- 판다스
- github
- git
- 프로그래밍입문
- 코드카타
- Python
- Til
- GoogleColab
- 내일배움캠프
- 데이터분석
- 데이터분석입문
- Tableau
- 중학생코딩
- 코딩처음
- 파이썬입문
- 통계
- 머신러닝
- 텍스트분석
- SQL
- 태블로
- 비전공자코딩
- 데이터시각화
- 구글코랩
- 파이썬
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
