1. AI(์ธ๊ณต์ง๋ฅ) ์ด๋?
: ์ฌ๋์ Intelligent๋ฅผ ๋ชจ๋ฐฉํ๋ ๊ธฐ๊ณ๋ฅผ ๋ง๋ค์ด๋ณด์!
- Thinking Humanly : ์ฌ๋๋ต๊ฒ ์๊ฐํ๋๊ฒ ๋ญ๋ฐ?
- Thinking Rationally : ๋ ผ๋ฆฌํ๊ณผ ๊ด๋ จ๋จ(3๋จ๋ ผ๋ฒ)
- Acting Humanly : Turing test
- Acting Rationally : ํฉ๋ฆฌ์ ์ผ๋ก ํ๋ํ๋ ๊ฒ๊ณผ ํฉ๋ฆฌ์ ์ผ๋ก ์๊ฐํ๋ ๊ฒ์ ๋ค๋ฆ (ํ๋ํ๋ค๊ณ ์๊ฐํ๋ ๊ฑด ์๋)
EX) ๋ค๋น๊ฒ์ด์
์ฆ, AI = Science(์๊ฐ) & Engineering(ํ๋)
(๊ดํธ์์ task environment for an automated taxi)
2. The Nature Of Environments
1) Specifying the task environment
: agent๊ฐ ์์ ๋ ์ฐ๋ฆฌ๋ PEAS description์ specify ํด์ผํ๋ค.
- Performance Measure (Safe, fast, legal, comfortable trip, maximize profits) : ๋ง๋ ๋ฐฉํฅ์ผ๋ก ๊ฐ๋์ง, trip time์ ์ต์ํ๋ก ํ๋์ง ๋ฑ์ goal
- Environment (Roads, other traffic, pedestrians, customers) : ์ฃผ์ด์ง ํ๊ฒฝ
- Actuators (Steering, accelerator, brake, signal, horn, display) : ํ์ฌ state์์ ์ํํ ์ ์๋ action
- Sensors (Cameras, sonar, speedometer, GPS ...) : ํ์ฌ state๋ฅผ ํ๋จํ ์ ์๋ sensor
์ด ๋ค๊ฐ์ง๊ฐ Task environment!
2) Properies of task environments
i. Fully observable vs Partially observable (unobservable)
: agents์ sensor๊ฐ ํ์ฌ ํ๊ฒฝ์ state๋ฅผ ์๋ฒฝํ ํ์ ํ ์ ์๋์ง ์๋์ง์ ๋ฌธ์
ii. Single agent vs multiagent
: agent์ ์. ์ฒด์ค๋ competitive multiagent environment๊ณ ํ์์์ ์ถฉ๋์ ํผํด ์ฑ๋ฅ์ ์ต๋ํํ๋ ๊ฒ์ ๋ชจ๋ agents์ ํ๋ ฅ์ ์ด๋ฏ๋ก partially cooperative multiagent environment ์ด๋ค.
iii. Deterministic vs Stochastic
: ํ์ฌ state์์ agent๊ฐ action์ ์ํํ์ ๋, ๊ทธ ๋ค์ state๋ฅผ ์๋ฒฝํ๊ฒ ๊ฒฐ์ ํ ์ ์๋์ง์ ์ฌ๋ถ. ๋ง์ฝ agent๊ฐ ๋ค์ state์ ์ ์ ์๋ค๋ฉด deterministicํ๊ณ ์๋๋ผ๋ฉด stochasticํ๋ค. ๋ง์ฝ fully observableํ๋ค๋ฉด deterministic ํ๊ธฐ ๋๋ฌธ์ ๋ถํ์ค์ฑ์ ๋ํด ๊ฑฑ์ ํ ํ์๊ฐ ์์ง๋ง, ๋ง์ฝ partially observableํ๋ค๋ฉด stochatic ํ ์ ์๋ค.
Not fully observableํ๊ฑฐ๋ not deterministicํ ํ๊ฒฝ์ผ ๋ ์ฐ๋ฆฌ๋ uncertainํ๋ค๊ณ ๋งํ๋ค. Stochastic์ด๋ผ๋ ๋จ์ด๋ ์ผ๋ฐ์ ์ผ๋ก ๊ฒฐ๊ณผ์ ๋ํ ๋ถํ์ค์ฑ์ด ํ๋ฅ ์ ๊ด์ ์์ ์ ๋ํ๋๋ ๊ฒ์ ๋งํ๋ค. Nondeterministic Environment์ด๋ actions์ด ๊ทธ๋ค์ ๊ฐ๋ฅํ ๊ฒฐ๊ณผ๋ฌผ์ ์ํด ํน์ ์ง์ด์ง์ง๋ง, ๊ทธ์ ๋ฐ๋ฅด๋ ํ๋ฅ ์ด ์๋ ํ๊ฒฝ์ด๋ค. Nondeterministic environment description์ ์ผ๋ฐ์ ์ผ๋ก agents๊ฐ action์ ๋ชจ๋ ๊ฐ๋ฅํ ๊ฒฐ๊ณผ๋ฅผ ์ ์์ ์ผ๋ก ์ฒ๋ฆฌํด์ผ ํ๋ performance measures์ ๊ด๋ จ์ด ์๋ค.
iv. Episodic vs Sequential
: episodic task environment์์ agent์ ๊ฒฝํ์ ATOMIC EPISODES๋ก ๋๋์ด์ง๋ค. ๊ฐ ์ํผ์๋์์ agent๋ ์ํฉ์ ์ธ์ํ๊ณ ์ด๋ค single action์ ์ํํ๋ค. ๊ทธ๋ฆฌ๊ณ ๋ค์ episode๋ previous episode์์ ์ทจํ action์ dependํ์ง ์๋ค. (๋๋ถ๋ถ์ classification tasks๊ฐ episodicํ๋ค)
sequential environment์์๋ ํ์ฌ์ ๊ฒฐ์ ์ด ๋ชจ๋ ๋ค์ ๊ฒฐ์ ๋ค์ ์ํฅ์ ๋ฏธ์น๋ค. ์ฒด์ค๋ ํ์ ์ด์ ๊ฐ์ ๊ฒ๋ค์ด sequantial ํ๋ค. Episodic environments๊ฐ sequential environment๋ณด๋ค ๋ ๊ฐ๋จํ๋ค.
v. Static vs dynamic
: ๋ง์ฝ environment๊ฐ agent๊ฐ ์ํ๋๋ ์ค ๋ณํ ์ ์๋ค๋ฉด, ์ฐ๋ฆฌ๋ ์ด ๋ environment๊ฐ dynamic(๋์ )์ด๋ผ๊ณ ํ๋ค. ๋ฐ๋๋ static(์ ์ )์ด๋ค. Static environments๋ ๋น๊ต์ ์ฝ๊ฒ ๋ค๋ฃฐ ์ ์๋ ๋ฐ๋ฉด, Dynamic environments์ ๊ฒฝ์ฐ์๋ agent์๊ฒ ๋ฌด์์ ํ๊ธฐ ์ํ๋์ง ๋์์์ด ๋ฌผ์ด๋ด์ผ ํ๋ค.
๋ง์ฝ ์๊ฐ์ ํ๋ฆ์ ๋ฐ๋ผ ํ๊ฒฝ ์์ฒด๋ ๋ณํ์ง ์์ง๋ง agent์ performance score๊ฐ ๋ณํํ๋ค๋ฉด ์ด๋ environment๊ฐ Semidynamicํ๋ค๊ณ ๋งํ๋ค. ํ์ ์ด์ ์ ์๋ฒฝํ dynamicํ๊ณ , Chess๋ฅผ ์๊ฐ์ ๋๊ณ ํ๋ค๋ฉด ์ด๋ semidynamic, Crossword puzzles์ staticํ๋ค.
vi. Discrete vs Continuous
: time์ด ์ด๋ป๊ฒ ๋ค๋ฃจ์ด์ง๋์ง, percepts์ actions์ด ์ด๋ค์ง์ state๋ฅผ ๋ฐ์ํ๋ค. ๋ง์ฝ chess environment๊ฐ ์ ํํ ์์ ์๋ก ๊ตฌ๋ณ๋๋ ๋ ๋ฆฝ์ ์ธ state๋ฅผ ๊ฐ๋๋ค๋ฉด chess๋ perceps์ actions์ discrete set์ด๋ค. ๋ฐ๋ฉด ํ์์ ๊ฒฝ์ฐ์๋ continuous state์ด์ continuous time problem์ด๋ค.
vii. Known vs Unknown
: ์ด๊ฒ์ environment ์์ฒด์ ๊ดํ ๊ฒ์ด ์๋๋ผ agent์ knowledge์ state์ ๊ดํ ๊ฒ์ด๋ค. Known environment๋ผ๋ฉด ๋ชจ๋ action์ ๋ํด outcome์ด ์ฃผ์ด์ง ๊ฒ์ด๊ณ , unknown ํ๋ค๋ฉด agent๋ ์ข์ ๊ฒฐ์ ์ ๋ด๋ฆฌ๊ธฐ ์ํด ์ด๋ป๊ฒ ์์ง์ฌ์ผ ํ๋์ง ํ์ตํด๋๊ฐ์ผ ํ ๊ฒ์ด๋ค. (fully and partially observal๊ณผ๋ ๋ค๋ฅธ ๊ฐ๋ ์ด๋ค) ์๋ฆฌํ ์ด ์นด๋๊ฒ์์ ๊ฒฝ์ฐ์๋ ๋๋ ๋ฃฐ์ ์์ง๋ง cards๋ฅผ ๋ณผ ์ ์์ด known environment์ด๋ฉด์ partially observableํ environments์ด๋ค. ๋ํ ์๋ก์ด ๋น๋์ค๊ฒ์์์ ๋๋ ๋ชจ๋ ๊ฒ์ state๋ฅผ ๋ณผ ์ ์์ผ๋ ๋ด๊ฐ ์ด๋ค ๋ฒํผ์ ๋๋ ์ ๋ ์ด๋ค ๋์์ ํ๋์ง ์ ์ ์์ด unkown environment์ด๋ฉด์ fully observableํ๋ค.
* fully observable, deterministic, discrete, and known environment ๋ผ๋ฉด ๊ทธ solution์ fixed sequence of actions์ด๋ค.
'๐ก๐ธ๐ธ๐ถ5: ๐ฆ๐๐๐๐ถ ๐ฐ๐๐พ๐ > Artificial Intelligence(COSE361)' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[์ธ๊ณต์ง๋ฅ] 4. Beyond Classical Search - 2 (0) | 2021.04.24 |
---|---|
[์ธ๊ณต์ง๋ฅ] 4. Beyond Classical Search - 1 (0) | 2021.04.24 |
[์ธ๊ณต์ง๋ฅ] 3. Solving problems by searching - 3 (0) | 2021.04.24 |
[์ธ๊ณต์ง๋ฅ] 3. Solving problems by searching - 2 (0) | 2021.04.23 |
[์ธ๊ณต์ง๋ฅ] 3. Solving problems by searching - 1 (0) | 2021.04.23 |