๐1์ฃผ์ฐจ 220110 ~ 220116 ๊ณต๋ถ๊ธฐ๋ก
๐ ๋ณธ ํฌ์คํ ์ <ํผ์ ๊ณต๋ถํ๋ ๋จธ์ ๋ฌ๋+๋ฅ๋ฌ๋> ์ฑ ์ ๋ฐํ์ผ๋ก ์์ฑํจ์ ์๋ฆฝ๋๋ค.
โ Ch.02-1 ํ๋ จ ์ธํธ์ ํ ์คํธ ์ธํธ
K-NN ์๊ณ ๋ฆฌ์ฆ ์ค์ต (1์๊ณผ 7์์ ํ๊ท ๊ธฐ์จ๊ณผ ์ผ๊ฐ์๋)
* Ch.01-3์์ ๋ค๋ฃฌ ์๊ณ ๋ฆฌ์ฆ ์ค์ต์ ํ๋ จ๊ณผ ํ ์คํธ๋ฅผ ๊ฐ์ ๋ฐ์ดํฐ๋ก ํ ์คํธ ํ์๊ธฐ ๋๋ฌธ์, ์ ํ๋๋ ๋น์ฐํ ๊ฒฐ๊ณผ์ด๋ค.
-> ํด๊ฒฐ๋ฐฉ๋ฒ : ํ๋ จ ๋ฐ์ดํฐ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ฐ ๋ค๋ฅด๊ฒ ํ์ฌ ์ฑ๋ฅ์ ํ๊ฐํ๋ค.
* ํ๋ จ ๋ฐ์ดํฐ : ํ๊ฐ์ ์ฌ์ฉํ๋ ๋ฐ์ดํฐ
* ํ ์คํธ ๋ฐ์ดํฐ : ํ๋ จ์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ
๐ฆ ๊ธฐ์จ๊ณผ ๊ฐ์๋์ ๋ฐ์ดํฐ๋ฅผ ํฉ์ณ ํ๋์ ํ์ด์ฌ 2์ฐจ์ ๋ฆฌ์คํธ๋ก ์ค๋น
โ fit() ๋ฉ์๋์ score() ๋ฉ์๋๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด ์ฌ์ดํท๋ฐ ํด๋์ค ์ํฌํธํ๊ธฐ
โ ์ํ๋ง ํธํฅ ์ฃผ์
sampling bias : ํ๋ จ ์ธํธ์ ํ ์คํธ ์ธํธ์ ์ํ์ด ๊ณจ๊ณ ๋ฃจ ์์ฌ ์์ง ์๊ณ , ์ํ๋ง์ด ํ์ชฝ์ผ๋ก ์น์ฐ์นจ
์ ๋ต๋ฐ์ดํฐ์ธ 7์ ๋ฐ์ดํฐ๋ฅผ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ฃ๊ณ , 1์ ๋ฐ์ดํฐ๋ฅผ ํ๋ จ ๋ฐ์ดํฐ์ ๋ฃ๋๋ค๋ฉด?
-> ํ๋ จ์ 1์ ๋ฐ์ดํฐ๋ก ํ์๊ธฐ ๋๋ฌธ์ 1์ ๋ฐ์ดํฐ๋ฐ์ ์ธ์ง๋ฅผ ๋ชปํจ.
๊ทธ ์ํ์์ 7์ ๋ฐ์ดํฐ๋ก ์ํ์ ์น๋ค๋ฉด ์ ํ๋๊ฐ 0์ด ๋์ฌ ์ ๋ฐ์ ์์.
๐ฆ ๋ํ์ด ๋ฐฐ์ด์ ์ค๋น
numpy : ํ์ด์ฌ์ ๋ํ์ ์ธ ๋ฐฐ์ด(array) ๋ผ์ด๋ธ๋ฌ๋ฆฌ. ๊ณ ์ฐจ์์ ๋ฐฐ์ด์ ์ฝ๊ฒ ๋ง๋ค๊ณ ์กฐ์ํ ์ ์๋ ๊ฐํธํ ๋๊ตฌ๋ฅผ ์ ๊ณต
ํ์ด์ฌ ๋ฆฌ์คํธ๋ฅผ ๋ํ์ด ๋ฐฐ์ด๋ก ๋ฐ๊พธ๊ธฐ → ๋ํ์ด array() ํจ์์ ํ์ด์ฌ ๋ฆฌ์คํธ๋ฅผ ์ ๋ฌ
์ ๋ ฅ๋ฐ์ดํฐ๋ฅผ 2์ฐจ์ ๋ฐฐ์ด๋กโ shape ์์ฑ : ๋ํ์ด ๋ฐฐ์ด ๊ฐ์ฒด๋ ๋ฐฐ์ด์ ํฌ๊ธฐ๋ฅผ ์๋ ค์ฃผ๋ ์์ฑ์ ์ ๊ณต
์ํ ์์ ํน์ฑ ์๋ฅผ ์ถ๋ ฅํด์ค๋ค.
์ ๋ ฅ๋ฐ์ดํฐ ๋ฐฐ์ด์ ํฌ๊ธฐ๋ฅผ ํ๋์๐ฆ ๋ฐฐ์ด์์ ๋๋คํ๊ฒ ์ํ์ ์ ํํด ํ๋ จ ์ธํธ์ ํ ์คํธ ์ธํธ ๋ง๋ค๊ธฐ
seed() : ๋ํ์ด์์ ๋์๋ฅผ ์์ฑํ๊ธฐ ์ํ ์ ์ ์ด๊น๊ฐ์ ์ง์ . ์ด๊น๊ฐ์ด ๊ฐ์ผ๋ฉด ๋์ผํ ๋์๋ฅผ ๋ฝ์ ์ ์์. ๋๋ค ํจ์์ ๊ฒฐ๊ณผ๋ฅผ ๋์ผํ๊ฒ ์ฌํํ๊ณ ์ถ์ ๋ ์ฌ์ฉ arange() : ์ผ์ ํ ๊ฐ๊ฒฉ์ ์ ์ ๋๋ ์ค์ ๋ฐฐ์ด์ ๋ง๋ฆ. ๊ธฐ๋ณธ ๊ฐ๊ฒฉ์ 1. shuffle() : ์ฃผ์ด์ง ๋ฐฐ์ด์ ๋ฌด์์๋ก ์์. ๋ค์ฐจ์ ๋ฐฐ์ด์ผ ๊ฒฝ์ฐ ์ฒซ ๋ฒ์งธ ์ถ(ํ)์ ๋ํด์๋ง ์๋๋ค. |
* random.seed๋ ์ด ์ค์ต์ ํ๋ ๋ชจ๋ ์ฌ๋์ด ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋๋ก ํจ. ๊ต์ก ๋ชฉ์ ์ผ๋ก ์ฑ ์ ์ฐ์์.
๊ฐ์ธ์ ์ผ๋ก ์ค์ต์ ํ๋ ๊ฒฝ์ฐ์๋ ๋๋ค ์๋๋ฅผ ์ค์ ํ์ง ์์๋ ๋๋ค. (๋๋ค ์๋๋ฅผ ์ค์ ํ์ง ์์ ๊ฒฝ์ฐ ์คํ์ ํ ๋๋ง๋ค ๋ค๋ฅธ ๊ฒฐ๊ณผ ๋์ถ)
1. 0๋ถํฐ 62๊น์ง ์ํ์ ์์๋๋ก ์ธ๋ฑ์ค๋ง๋ค๊ณ ๋ถ์ฌํด์ค๋ค. (arange() ํจ์ ์ฌ์ฉ)
2. ์ธ๋ฑ์ค๋ฅผ ๋ฌด์์๋ก ์๋๋ค. (๊ฐ ์ํ์ ๊ฐ ๋ฒํธ(์ธ๋ฑ์ค)๋ฅผ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ ์ธ๋ฑ์ค ๋ฒํธ์ ๋ง๊ฒ ๊ฐ์ด ๋๋ค)
3. ์์ ์ธ๋ฑ์ค์ ๋ฆฌ์คํธ๋ฅผ ๊ฐ์ง๊ณ ํ๋ จ ์ธํธ์ ํ ์คํธ ์ธํธ ๊ตฌ๋ถ
(3๋ฒ์์ ๋ฐฐ์ด ์ธ๋ฑ์ฑ์ ์ฌ์ฉ. ๋ํ์ด ๋ฐฐ์ด์ ์ธ๋ฑ์ค๋ก ์ ๋ฌ)
๐ฆ ์ฐ์ ๋๋ก ํ์ธ
๐ฆ K-NN ๋ชจ๋ธ์ ํ๋ จ (with. ํ๋ จ ์ธํธ&ํ ์คํธ ์ธํธ)
ํ ์คํธ ์ธํธ์ ๋ํ ์์ธก ๊ฒฐ๊ณผ๊ฐ ์ ๋ต๊ณผ ์ผ์นํจ์ ์ ์ ์์.
'Study > AI & ML' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
ํ๊ท ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ชจ๋ธ ๊ท์ (3) - ํน์ฑ ๊ณตํ๊ณผ ๊ท์ (0) | 2024.03.15 |
---|---|
ํ๊ท ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ชจ๋ธ ๊ท์ (2) - ์ ํ ํ๊ท (4) | 2024.03.15 |
ํ๊ท ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ชจ๋ธ ๊ท์ (1) - K-์ต๊ทผ์ ์ด์ ํ๊ท (3) | 2024.03.15 |
๋์ ์ฒซ ๋จธ์ ๋ฌ๋&๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ (3) (1) | 2024.03.15 |
๋์ ์ฒซ ๋จธ์ ๋ฌ๋&๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ (1) (0) | 2024.03.15 |