- ÇöÀç À§Ä¡
- home > ÄÄÇ»ÅÍ¡¤ICT¡¤¾îÇÐ > ÄÄÇ»ÅÍ¡¤IT µµ¼ > ÄÄÇ»ÅÍ°øÇÐ > Quantitative Economics with R[¿¡ÀÌÄÜÃâÆÇ]
µ¥ÀÌÅÍ °úÇп¡ ÃÊÁ¡À» ¸ÂÃç °è·®°æÁ¦ÇÐÀÇ Çö´ëÀûÀÎ ºÐ¼® ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. R°ú RStudio¸¦ ¼Ò°³ÇÏ°í Çص鸮 À§ÄÄ(Hadley Wickham)ÀÌ °³¹ßÇÑ tidyverse ÆÐÅ°Áö¸¦ ÀÌ¿ëÇØ µ¥ÀÌÅÍ ºÐ¼® ¿öÅ©Ç÷οìÀÇ ¿©·¯ ºÎºÐÀ» ¼³¸íÇÑ´Ù. R Äڵ带 ÀÌ¿ëÇÑ °£°áÇÑ ¼³¸í ÈÄ¿¡ R ±â¼úÀ» ¿¬¸¶ÇÒ ¼ö ÀÖÀ¸¸ç, ½Ç½ÀÀ¸·Î ÀÌÇØÀÇ ÆøÀ» ³ÐÈú ¼ö ÀÖ´Ù.
ÀúÀÚ: ºñÅ©¶÷ ´Ù¾â
1ºÎ. Ã¥ÀÇ ±¸¼º°ú R ¼Ò°³
1Àå. °³¿ä
2Àå. R°ú RStudio
2ºÎ. µ¥ÀÌÅÍ °ü¸®¿Í ±×·¡ÇÁ ÀÛ¼º
3Àå. R·Î µ¥ÀÌÅÍ °¡Á®¿À±â
4Àå. µ¥ÀÌÅÍ ·©±Û¸µ°ú ±×·¡ÇÁ ÀÛ¼º
5Àå. ³×Æ®¿öÅ©
3ºÎ. µ¥ÀÌÅÍ ºÐ¼®¿¡ ÇÊ¿äÇÑ ¼öÇÐ »çÀüÁö½Ä
6Àå. ÇÔ¼ö
7Àå Â÷ºÐ¹æÁ¤½Ä
8Àå. Çà·Ä
4ºÎ. µ¥ÀÌÅÍ ±â¹Ý Ãß·Ð
9Àå. Åë°èÀû Ãß·Ð
10Àå. ÀΰúÀû Ãß·Ð
5ºÎ. ¼ºÀå µ¥ÀÌÅÍ Á¢±Ù, ºÐ¼®, Çؼ®
11Àå. ¼ºÀå µ¥ÀÌÅÍ¿Í ¸ðÇü
12Àå. ¼ºÀå ¿øÀÎ
6ºÎ. ½Ã°è¿ µ¥ÀÌÅÍ
13Àå. ½Ã°è¿ ±×·¡ÇÁ
14Àå. ½Ã°è¿ ¸ðÇü
7ºÎ. µ¥ÀÌÅ͸¦ ÅëÇÑ Åë°èÀû ÇнÀ°ú ¸Ó½Å·¯´×
15Àå. ÆòÈ°±â¿Í ÀϹÝÈ °¡¹ý ¸ðÇü
16Àå. Æ®¸®ºÎÅÍ ·£´ý Æ÷·¹½ºÆ®±îÁö
1Àå. °³¿ä
2Àå. R°ú RStudio
2ºÎ. µ¥ÀÌÅÍ °ü¸®¿Í ±×·¡ÇÁ ÀÛ¼º
3Àå. R·Î µ¥ÀÌÅÍ °¡Á®¿À±â
4Àå. µ¥ÀÌÅÍ ·©±Û¸µ°ú ±×·¡ÇÁ ÀÛ¼º
5Àå. ³×Æ®¿öÅ©
3ºÎ. µ¥ÀÌÅÍ ºÐ¼®¿¡ ÇÊ¿äÇÑ ¼öÇÐ »çÀüÁö½Ä
6Àå. ÇÔ¼ö
7Àå Â÷ºÐ¹æÁ¤½Ä
8Àå. Çà·Ä
4ºÎ. µ¥ÀÌÅÍ ±â¹Ý Ãß·Ð
9Àå. Åë°èÀû Ãß·Ð
10Àå. ÀΰúÀû Ãß·Ð
5ºÎ. ¼ºÀå µ¥ÀÌÅÍ Á¢±Ù, ºÐ¼®, Çؼ®
11Àå. ¼ºÀå µ¥ÀÌÅÍ¿Í ¸ðÇü
12Àå. ¼ºÀå ¿øÀÎ
6ºÎ. ½Ã°è¿ µ¥ÀÌÅÍ
13Àå. ½Ã°è¿ ±×·¡ÇÁ
14Àå. ½Ã°è¿ ¸ðÇü
7ºÎ. µ¥ÀÌÅ͸¦ ÅëÇÑ Åë°èÀû ÇнÀ°ú ¸Ó½Å·¯´×
15Àå. ÆòÈ°±â¿Í ÀϹÝÈ °¡¹ý ¸ðÇü
16Àå. Æ®¸®ºÎÅÍ ·£´ý Æ÷·¹½ºÆ®±îÁö
¢Â ÀÌ Ã¥¿¡¼ ´Ù·ç´Â ³»¿ë ¢Â
µ¥ÀÌÅÍ °úÇÐÀÇ Á߽ɿ¡´Â µ¥ÀÌÅÍ°¡ ÀÖÀ¸¸ç, ÀÌ Ã¥¿¡¼´Â ³×Æ®¿öÅ© µ¥ÀÌÅ͸¦ Æ÷ÇÔÇØ µ¥ÀÌÅ͸¦ °¡Á®¿À°í ·©±Û¸µ(wrangling)ÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ¶ÇÇÑ ÃʹݺκÎÅÍ ¸¹ÀÌ »ç¿ëÇÏ´Â ggplot2 ÆÐÅ°Áö¸¦ ÀÌ¿ëÇØ µ¥ÀÌÅÍ ½Ã°¢È ÀÛ¾÷À» »ìÆ캸¸ç, ±âº»ÀûÀÎ Áöµµµµ ÀÛ¼ºÇغ»´Ù. ÇÔ¼ö ÀÌÇØ, Â÷ºÐ¹æÁ¤½Ä ½Ã¹Ä·¹À̼Ç, Çà·Ä ¿¬»ê ¼öÇà¿¡ RÀ» »ç¿ëÇÏ´Â ¹æ¹ýµµ ´Ù·é´Ù. ÀÌ Ã¥Àº ¸óÅ×Ä«¸¦·Î(Monte Carlo) ½Ã¹Ä·¹À̼ÇÀ» »ç¿ëÇØ È®·ü°ú Åë°èÀû Ãß·Ð(statistical inference)À» ÀÌÇØÇϸç, ºÎÆ®½ºÆ®·¦µµ ¼Ò°³ÇÑ´Ù. ÀΰúÀû Ãß·Ð(causal inference)Àº ½ÇÇè(experiment), ¸ÅĪ(matching), ȸ±Í ºÒ¿¬¼Ó(regression discontinuity), ÀÌÁßÂ÷ºÐ¹ý(difference-in-difference), µµ±¸ º¯¼ö(instrumental variable)¸¦ ´Ù·ç´Â ½ÇÁ¦ °æÁ¦ ¿¹Á¦¿Í ÇÔ²² È°¿ëÀ» À§ÇØ ½Ã¹Ä·¹À̼Ç, µ¥ÀÌÅÍ ±×·¡ÇÁ, R Äڵ带 »ç¿ëÇØ ÁýÁßÀûÀ¸·Î »ìÆ캻´Ù. ¼ºÀå°ú °ü·ÃµÈ µ¥ÀÌÅÍ¿Í ¸ðÇüÀÇ »óÈ£ÀÛ¿ëÀ» ¼³¸íÇϸç, ÀÌÈÄ¿¡ ±×·¡ÇÁ, ½Ã¹Ä·¹À̼Ç, ¿¹Á¦¸¦ »ç¿ëÇØ ½Ã°è¿ µ¥ÀÌÅÍ ºÐ¼®À» »ìÆ캻´Ù. ¸¶Áö¸·À¸·Î, µÎ °¡Áö °è»ê Áý¾àÀû ¹æ¹ýÀÎ ÀϹÝÈ °¡¹ý ¸ðÇü(generalized additive model)°ú ¸Ó½Å·¯´× ºÐ¾ß¿¡¼ ¸¹ÀÌ »ç¿ëÇÏ´Â ·£´ý Æ÷·¹½ºÆ®(random forest)¸¦ È°¿ë¹ý°ú ÇÔ²² Á÷°üÀûÀ¸·Î »ìÆ캻´Ù.
¢Â ÀÌ Ã¥ÀÇ ´ë»ó µ¶ÀÚ ¢Â
RÀ» ¹è¿ì°íÀÚ ÇÏ´Â Çлý, ±³»ç, ¿¬±¸¿ø µîÀÇ °æÁ¦Çеµµé¿¡°Ô µµ¿òÀÌ µÉ Ã¥ÀÌ´Ù. ƯÈ÷ °æÁ¦Çаú ÇлýµéÀÌ ÀÀ¿ë°æÁ¦ÇÐÀ» Á÷°üÀûÀ¸·Î ÀÌÇØÇÏ°í, ÀڷḦ Àû±ØÀûÀ¸·Î È°¿ëÇϸç, µ¿½Ã¿¡ ÇÙ½É µ¥ÀÌÅÍ °úÇÐ ±â¼úÀ» °®Ãß´Â µ¥ µµ¿òÀÌ µÉ °ÍÀÌ´Ù.
¢Â ÀÌ Ã¥ÀÇ ±¸¼º ¢Â
1ºÎ, Ã¥ ±¸¼º°ú R ¼Ò°³¿¡¼´Â RÀÇ ÁÖ¿ä ³»¿ëÀ» ÃæºÐÈ÷ ¼Ò°³ÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÑ´Ù.
2ºÎ, µ¥ÀÌÅÍ °ü¸®¿Í ±×·¡ÇÁ ÀÛ¼º¿¡¼´Â À§ÄÄÀÌ °³¼±ÇÑ µ¥ÀÌÅÍ °úÇÐÀÇ Æ¯¼º Áß ÇϳªÀÎ ·©±Û¸µ°ú ±×·¡ÇÁ ÀÛ¼ºÀ» ¼Ò°³ÇÑ´Ù.
3ºÎ, µ¥ÀÌÅÍ ºÐ¼®¿¡ ÇÊ¿äÇÑ ¼öÇÐ »çÀüÁö½Ä¿¡¼´Â RÀ» »ç¿ëÇÑ °£´ÜÇÑ ¼öÇÐÀû ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ƯÈ÷ Â÷ºÐ ¹æÁ¤½Ä(difference equations)°ú ÇÔ²² R·Î ´Ù¾çÇÑ ºÐ¼®À» ¼öÇàÇÑ´Ù.
4ºÎ, µ¥ÀÌÅÍ ±â¹Ý Ã߷п¡¼´Â Á᫐ ±ØÇÑ Á¤¸®(central limit theorem)¿¡ ½Ã¹Ä·¹À̼ÇÀ» »ç¿ëÇÑ´Ù. ¶ÇÇÑ ºÎÆ®½ºÆ®·¦°ú ¹«ÀÛÀ§ Ãß·Ð(randomization inference)À̶ó´Â µÎ °¡Áö ½Ã¹Ä·¹ÀÌ¼Ç ±â¹Ý Ãß·Ð ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù.
5ºÎ, ¼ºÀå µ¥ÀÌÅÍ Á¢±Ù, ºÐ¼®, Çؼ®¿¡¼´Â °æÁ¦ ¼ºÀåÀ» ÁýÁßÀûÀ¸·Î »ìÆ캻´Ù. µ¥ÀÌÅ͸¦ ½Ã°¢ÈÇØ ¼ºÀåÀÇ Æ¯Á¤ À¯ÇüÀ» Á¶»çÇÏ°í µ¥ÀÌÅ͸¦ ÅëÇØ °£´ÜÇÑ ¼ºÀå ÀÌ·ÐÀ» ¾Ë¾Æº»´Ù.
6ºÎ, ½Ã°è¿ µ¥ÀÌÅÍ´Â ½Ã°è¿(time series) µ¥ÀÌÅ͸¦ ´Ù·ç¸ç, ½Ã°è¿ ±×·¡ÇÁ ÀÛ¼º¹ýÀ» »ìÆ캻´Ù.
7ºÎ, µ¥ÀÌÅ͸¦ ÅëÇÑ Åë°èÀû ÇнÀ°ú ¸Ó½Å·¯´×¿¡¼´Â ¹Ù¸®¾È(Varian, 2014)ÀÌ ¾´ ³í¹® ¡¸Big Data: New Tricks for Econometrics¡¹¸¦ Âü°íÇÑ´Ù. Åë°èÀû ÇнÀ(statistical learning)ÀÇ µÎ °¡Áö ÁÖ¿ä ±â¹ýÀÎ ÀϹÝÈ °¡¹ý ¸ðÇü(GAM, generalized additive model)°ú ·£´ý Æ÷·¹½ºÆ®¸¦ »ìÆ캻´Ù.
µ¥ÀÌÅÍ °úÇÐÀÇ Á߽ɿ¡´Â µ¥ÀÌÅÍ°¡ ÀÖÀ¸¸ç, ÀÌ Ã¥¿¡¼´Â ³×Æ®¿öÅ© µ¥ÀÌÅ͸¦ Æ÷ÇÔÇØ µ¥ÀÌÅ͸¦ °¡Á®¿À°í ·©±Û¸µ(wrangling)ÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ¶ÇÇÑ ÃʹݺκÎÅÍ ¸¹ÀÌ »ç¿ëÇÏ´Â ggplot2 ÆÐÅ°Áö¸¦ ÀÌ¿ëÇØ µ¥ÀÌÅÍ ½Ã°¢È ÀÛ¾÷À» »ìÆ캸¸ç, ±âº»ÀûÀÎ Áöµµµµ ÀÛ¼ºÇغ»´Ù. ÇÔ¼ö ÀÌÇØ, Â÷ºÐ¹æÁ¤½Ä ½Ã¹Ä·¹À̼Ç, Çà·Ä ¿¬»ê ¼öÇà¿¡ RÀ» »ç¿ëÇÏ´Â ¹æ¹ýµµ ´Ù·é´Ù. ÀÌ Ã¥Àº ¸óÅ×Ä«¸¦·Î(Monte Carlo) ½Ã¹Ä·¹À̼ÇÀ» »ç¿ëÇØ È®·ü°ú Åë°èÀû Ãß·Ð(statistical inference)À» ÀÌÇØÇϸç, ºÎÆ®½ºÆ®·¦µµ ¼Ò°³ÇÑ´Ù. ÀΰúÀû Ãß·Ð(causal inference)Àº ½ÇÇè(experiment), ¸ÅĪ(matching), ȸ±Í ºÒ¿¬¼Ó(regression discontinuity), ÀÌÁßÂ÷ºÐ¹ý(difference-in-difference), µµ±¸ º¯¼ö(instrumental variable)¸¦ ´Ù·ç´Â ½ÇÁ¦ °æÁ¦ ¿¹Á¦¿Í ÇÔ²² È°¿ëÀ» À§ÇØ ½Ã¹Ä·¹À̼Ç, µ¥ÀÌÅÍ ±×·¡ÇÁ, R Äڵ带 »ç¿ëÇØ ÁýÁßÀûÀ¸·Î »ìÆ캻´Ù. ¼ºÀå°ú °ü·ÃµÈ µ¥ÀÌÅÍ¿Í ¸ðÇüÀÇ »óÈ£ÀÛ¿ëÀ» ¼³¸íÇϸç, ÀÌÈÄ¿¡ ±×·¡ÇÁ, ½Ã¹Ä·¹À̼Ç, ¿¹Á¦¸¦ »ç¿ëÇØ ½Ã°è¿ µ¥ÀÌÅÍ ºÐ¼®À» »ìÆ캻´Ù. ¸¶Áö¸·À¸·Î, µÎ °¡Áö °è»ê Áý¾àÀû ¹æ¹ýÀÎ ÀϹÝÈ °¡¹ý ¸ðÇü(generalized additive model)°ú ¸Ó½Å·¯´× ºÐ¾ß¿¡¼ ¸¹ÀÌ »ç¿ëÇÏ´Â ·£´ý Æ÷·¹½ºÆ®(random forest)¸¦ È°¿ë¹ý°ú ÇÔ²² Á÷°üÀûÀ¸·Î »ìÆ캻´Ù.
¢Â ÀÌ Ã¥ÀÇ ´ë»ó µ¶ÀÚ ¢Â
RÀ» ¹è¿ì°íÀÚ ÇÏ´Â Çлý, ±³»ç, ¿¬±¸¿ø µîÀÇ °æÁ¦Çеµµé¿¡°Ô µµ¿òÀÌ µÉ Ã¥ÀÌ´Ù. ƯÈ÷ °æÁ¦Çаú ÇлýµéÀÌ ÀÀ¿ë°æÁ¦ÇÐÀ» Á÷°üÀûÀ¸·Î ÀÌÇØÇÏ°í, ÀڷḦ Àû±ØÀûÀ¸·Î È°¿ëÇϸç, µ¿½Ã¿¡ ÇÙ½É µ¥ÀÌÅÍ °úÇÐ ±â¼úÀ» °®Ãß´Â µ¥ µµ¿òÀÌ µÉ °ÍÀÌ´Ù.
¢Â ÀÌ Ã¥ÀÇ ±¸¼º ¢Â
1ºÎ, Ã¥ ±¸¼º°ú R ¼Ò°³¿¡¼´Â RÀÇ ÁÖ¿ä ³»¿ëÀ» ÃæºÐÈ÷ ¼Ò°³ÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÑ´Ù.
2ºÎ, µ¥ÀÌÅÍ °ü¸®¿Í ±×·¡ÇÁ ÀÛ¼º¿¡¼´Â À§ÄÄÀÌ °³¼±ÇÑ µ¥ÀÌÅÍ °úÇÐÀÇ Æ¯¼º Áß ÇϳªÀÎ ·©±Û¸µ°ú ±×·¡ÇÁ ÀÛ¼ºÀ» ¼Ò°³ÇÑ´Ù.
3ºÎ, µ¥ÀÌÅÍ ºÐ¼®¿¡ ÇÊ¿äÇÑ ¼öÇÐ »çÀüÁö½Ä¿¡¼´Â RÀ» »ç¿ëÇÑ °£´ÜÇÑ ¼öÇÐÀû ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. ƯÈ÷ Â÷ºÐ ¹æÁ¤½Ä(difference equations)°ú ÇÔ²² R·Î ´Ù¾çÇÑ ºÐ¼®À» ¼öÇàÇÑ´Ù.
4ºÎ, µ¥ÀÌÅÍ ±â¹Ý Ã߷п¡¼´Â Á᫐ ±ØÇÑ Á¤¸®(central limit theorem)¿¡ ½Ã¹Ä·¹À̼ÇÀ» »ç¿ëÇÑ´Ù. ¶ÇÇÑ ºÎÆ®½ºÆ®·¦°ú ¹«ÀÛÀ§ Ãß·Ð(randomization inference)À̶ó´Â µÎ °¡Áö ½Ã¹Ä·¹ÀÌ¼Ç ±â¹Ý Ãß·Ð ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù.
5ºÎ, ¼ºÀå µ¥ÀÌÅÍ Á¢±Ù, ºÐ¼®, Çؼ®¿¡¼´Â °æÁ¦ ¼ºÀåÀ» ÁýÁßÀûÀ¸·Î »ìÆ캻´Ù. µ¥ÀÌÅ͸¦ ½Ã°¢ÈÇØ ¼ºÀåÀÇ Æ¯Á¤ À¯ÇüÀ» Á¶»çÇÏ°í µ¥ÀÌÅ͸¦ ÅëÇØ °£´ÜÇÑ ¼ºÀå ÀÌ·ÐÀ» ¾Ë¾Æº»´Ù.
6ºÎ, ½Ã°è¿ µ¥ÀÌÅÍ´Â ½Ã°è¿(time series) µ¥ÀÌÅ͸¦ ´Ù·ç¸ç, ½Ã°è¿ ±×·¡ÇÁ ÀÛ¼º¹ýÀ» »ìÆ캻´Ù.
7ºÎ, µ¥ÀÌÅ͸¦ ÅëÇÑ Åë°èÀû ÇнÀ°ú ¸Ó½Å·¯´×¿¡¼´Â ¹Ù¸®¾È(Varian, 2014)ÀÌ ¾´ ³í¹® ¡¸Big Data: New Tricks for Econometrics¡¹¸¦ Âü°íÇÑ´Ù. Åë°èÀû ÇнÀ(statistical learning)ÀÇ µÎ °¡Áö ÁÖ¿ä ±â¹ýÀÎ ÀϹÝÈ °¡¹ý ¸ðÇü(GAM, generalized additive model)°ú ·£´ý Æ÷·¹½ºÆ®¸¦ »ìÆ캻´Ù.