- ÇöÀç À§Ä¡
- home > ÄÄÇ»ÅÍ¡¤ICT¡¤¾îÇÐ > ÄÄÇ»ÅÍ¡¤IT µµ¼ > Àü»êÅë°è/Çؼ® > º£ÀÌÁö¾ÈÀ¸·Î Á¢±ÙÇÏ´Â ÀÚ¿¬¾î ó¸® 2/e[¿¡ÀÌÄÜÃâÆÇ]
1980³â´ë Áß¹Ý, ¾ð¾î¸¦ ºÐ¼®Çϱâ À§ÇØ ¸»¹¶Ä¡¿Í µ¥ÀÌÅÍ ±â¹Ý ±â¼úÀ» ¸¹ÀÌ »ç¿ëÇÏ¸é¼ ÀÚ¿¬¾î 󸮴 Áß´ëÇÑ º¯È¸¦ °Þ¾ú´Ù. ±× ÀÌÈÄ ÀÚ¿¬¾î 󸮿¡¼ Åë°è ±â¹ýÀ» »ç¿ëÇÏ´Â ¹æ¹ýÀº ¸¹Àº ¹ßÀüÀÌ ÀÖ¾ú´Ù. ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ º£ÀÌÁö¾È Á¢±Ù ¹æ½ÄÀº 1990³â´ë ÈĹݿ¡¼ 2000³â´ë Ãʹݿ¡ º»°ÝÀûÀ¸·Î ¹ßÀüÇϱ⠽ÃÀÛÇß´Ù. ºóµµÁÖÀÇÀû Á¢±Ù ¹æ½ÄÀÇ ´ÜÁ¡À» °³¼±ÇÏ°í ƯÈ÷ Åë°èÀû ÇнÀÀÌ Á¦´ë·Î ¼öÇàµÇÁö ¾Ê´Â ºñÁöµµÇнÀ ȯ°æ¿¡¼ ¸¹Àº ºÎºÐÀ» º¸¿ÏÇß´Ù.
ÀÌ Ã¥¿¡¼´Â ÀÚ¿¬¾î ó¸®ÀÇ º£ÀÌÁö¾È ÇнÀ¿¡ °ü·ÃµÈ ¿¬±¸¸¦ ÇÒ ¶§ À̸¦ ÀÌÇØÇÏ´Â µ¥ ÇÊ¿äÇÑ ¹æ¹ý°ú ¾Ë°í¸®ÁòÀ» ´Ù·é´Ù. ÀÌ·¯ÇÑ ¾Ë°í¸®ÁòÀº ´ëºÎºÐ ¸Ó½Å·¯´×°ú Åë°è¿¡¼ Â÷¿ëµÇ°í ºÎºÐÀûÀ¸·Î ÀÚ¿¬¾î ó¸® ¹æ¹ýÀ» Âü°íÇÑ´Ù. ¸¶ÄÚÇÁ üÀÎ, ¸óÅ×Ä«¸¦·Î »ùÇøµ ¹× º¯ºÐ Ãß·Ð, º£ÀÌÁö¾È ÃßÁ¤, ºñ¸ð¼ö ¸ðµ¨¸µ°ú °°Àº Ãß·Ð ±â¹ýÀ» ´Ù·é´Ù. ¶ÇÇÑ »çÀüºÐÆ÷, ÄÓ·¹ ¹× »ý¼º ¸ðµ¨¸µ°ú °°Àº ±âº»ÀûÀÎ º£ÀÌÁö¾È Åë°è °³³äµµ ÇÔ²² ´Ù·é´Ù. ¸¶Áö¸·À¸·Î ¹®¹ý ¸ðµ¨¸µ, ½Å°æ¸Á ¹× Ç¥ÇöÇнÀ°ú °°Àº ÀÚ¿¬¾î ó¸®ÀÇ ±âº» ¸ðµ¨¸µ ±â¼ú°ú º£ÀÌÁö¾ÈÀ» È°¿ëÇÑ ºÐ¼®µµ ´Ù·é´Ù.
ÀÌ Ã¥¿¡¼´Â ÀÚ¿¬¾î ó¸®ÀÇ º£ÀÌÁö¾È ÇнÀ¿¡ °ü·ÃµÈ ¿¬±¸¸¦ ÇÒ ¶§ À̸¦ ÀÌÇØÇÏ´Â µ¥ ÇÊ¿äÇÑ ¹æ¹ý°ú ¾Ë°í¸®ÁòÀ» ´Ù·é´Ù. ÀÌ·¯ÇÑ ¾Ë°í¸®ÁòÀº ´ëºÎºÐ ¸Ó½Å·¯´×°ú Åë°è¿¡¼ Â÷¿ëµÇ°í ºÎºÐÀûÀ¸·Î ÀÚ¿¬¾î ó¸® ¹æ¹ýÀ» Âü°íÇÑ´Ù. ¸¶ÄÚÇÁ üÀÎ, ¸óÅ×Ä«¸¦·Î »ùÇøµ ¹× º¯ºÐ Ãß·Ð, º£ÀÌÁö¾È ÃßÁ¤, ºñ¸ð¼ö ¸ðµ¨¸µ°ú °°Àº Ãß·Ð ±â¹ýÀ» ´Ù·é´Ù. ¶ÇÇÑ »çÀüºÐÆ÷, ÄÓ·¹ ¹× »ý¼º ¸ðµ¨¸µ°ú °°Àº ±âº»ÀûÀÎ º£ÀÌÁö¾È Åë°è °³³äµµ ÇÔ²² ´Ù·é´Ù. ¸¶Áö¸·À¸·Î ¹®¹ý ¸ðµ¨¸µ, ½Å°æ¸Á ¹× Ç¥ÇöÇнÀ°ú °°Àº ÀÚ¿¬¾î ó¸®ÀÇ ±âº» ¸ðµ¨¸µ ±â¼ú°ú º£ÀÌÁö¾ÈÀ» È°¿ëÇÑ ºÐ¼®µµ ´Ù·é´Ù.
ÀúÀÚ: »þÀÌ ÄÚÇî Àú/ÀÌÀç¿ø,±è¸íÁØ ¿ª
1Àå. ¸Ó¸®¸»
1.1 È®·ü ÃøÁ¤: È®·üÃøµµ, È®·üÇÔ¼ö
1.2 ¹«ÀÛÀ§ º¯¼ö
1.2.1 ¿¬¼Ó°ú ÀÌ»ê È®·ü º¯¼ö
1.2.2 ´ÙÁß·£´ýº¯¼öÀÇ °áÇÕÈ®·üºÐÆ÷
1.3 Á¶°ÇºÎºÐÆ÷
1.3.1 º£ÀÌÁî Á¤¸®
1.3.2 µ¶¸³ ±×¸®°í Á¶°ÇºÎ µ¶¸³ ·£´ýº¯¼ö
1.3.3 ±³È¯ °¡´ÉÇÑ ·£´ýº¯¼ö
1.4 ·£´ýº¯¼ö ±â´ñ°ª
1.5 ¸ðµ¨
1.5.1 ¸ð¼ö ´ë ºñ¸ð¼ö ¸ðµ¨
1.5.2 ¸ðµ¨·ÎºÎÅÍ Ãß·Ð
1.5.3 »ý¼º ¸ðµ¨
1.5.4 ¸ðµ¨ÀÇ µ¶¸³ °¡Á¤
1.5.5 ¹æÇ⼺ ±×·¡ÇÁ ¸ðµ¨
1.6 ½Ã³ª¸®¿À µ¥ÀÌÅͷκÎÅÍ ÇнÀ
1.7 º£ÀÌÁî¿Í ºóµµÁÖÀÇ Ã¶ÇÐ
1.8 ¿ä¾à
1.9 ¿¬½À ¹®Á¦
2Àå. °³¿ä
2.1 °³¿ä: º£ÀÌÁö¾È Åë°èÇаú NLPÀÇ Á¢Á¡
2.2 ù ¹ø° ¿¬½À ¹®Á¦: ÀáÀç µð¸®Å¬·¹ ÇÒ´ç ¸ðµ¨
2.2.1 µð¸®Å¬·¹ºÐÆ÷
2.2.2 Ãß·Ð
2.2.3 ¿ä¾à Á¤¸®
2.3 µÎ ¹ø° ¿¬½À ¹®Á¦: º£ÀÌÁö¾È ÅؽºÆ® ȸ±Í
2.4 °á·Ð°ú ¿ä¾à
2.5 ¿¬½À ¹®Á¦
3Àå. »çÀüÈ®·üºÐÆ÷
3.1 ÄÓ·¹»çÀüºÐÆ÷
3.1.1 ÄÓ·¹»çÀüÈ®·ü°ú Á¤±ÔÈ »ó¼ö
3.1.2 ÀáÀ纯¼ö¸ðµ¨ÀÇ ÄÓ·¹»çÀüÈ®·ü È°¿ë
3.1.3 ÄÓ·¹»çÀüÈ®·üºÐÆ÷ÀÇ È¥ÇÕ
3.1.4 ÀçÁ¤±ÔÈµÈ ÄÓ·¹ºÐÆ÷
3.1.5 ³íÀÇ: °áÇյǰųª °áÇÕµÇÁö ¾Ê´Â´Ù?
3.1.6 ¿ä¾à
3.2 ´ÙÇ׺ÐÆ÷¿Í Ä«Å×°í¸®ºÐÆ÷¿¡ ´ëÇÑ »çÀüÈ®·ü
3.2.1 µð¸®Å¬·¹ºÐÆ÷ ¸®ºä
3.2.2 ·ÎÁö½ºÆ½Á¤±ÔºÐÆ÷
3.2.3 ³íÀÇ
3.2.4 ¿ä¾à
3.3 ºñ - Á¤º¸¼º »çÀüÈ®·üºÐÆ÷
3.3.1 UNIFORM AND IMPROPER PRIORS
3.3.2 Jeffreys Prior
3.3.3 DISCUSSION
3.4 CONJUGACY AND EXPONENTIAL MODELS
3.5 ¸ðµ¨ÀÌ °®´Â ´ÙÁß ÆĶó¹ÌÅÍ
3.6 ±¸Á¶Àû »çÀüÈ®·üºÐÆ÷
3.7 °á·Ð ¹× Á¤¸®
3.8 ¿¬½À ¹®Á¦
4Àå. º£ÀÌÁî ÃßÁ¤
4.1 ÀáÀ纯¼ö¸¦ ÅëÇØ ¹è¿ö º¼ µÎ °¡Áö °üÁ¡
4.2 º£ÀÌÁö¾È Á¡ ÃßÁ¤
4.2.1 ÃÖ´ë »çÈÄÈ®·ü ÃßÁ¤ ¹æ¹ý
4.2.2 ÃÖ´ë»çÈÄÈ®·ü¹æ¹ý¿¡ µû¸¥ »çÈÄÈ®·üºÐÆ÷ ±Ù»ç
4.2.3 °áÁ¤ÀÌ·Ð Á¡ ÃßÁ¤Ä¡
4.2.4 Á¤¸®
4.3 ½ÇÇèÀû º£ÀÌÁî Á¤¸®
4.4 »çÈÄÈ®·üºÐÆ÷ÀÇ Á¡±ÙÀû Çൿ
4.5 ¿ä¾à
4.6 ¿¬½À ¹®Á¦
5Àå. »ùÇøµ(Ç¥Áý) ¹æ¹ý
5.1 MCMC ¾Ë°í¸®Áò: °³¿ä
5.2 MCMC Ãß·ÐÀ» À§ÇÑ ÀÚ¿¬¾î ó¸® ¸ðµ¨ ±¸Á¶
5.2.1 ÀáÀ纯¼ö ºÐÇÒ¹ý
5.3 ±é½º »ùÇøµ
5.3.1 Ãà¼ÒµÈ ±é½º »ùÇøµ
5.3.2 ¿¬»êÀÚ °üÁ¡
5.3.3 ±é½º »ùÇ÷¯ º´·ÄÈ
5.3.4 ¿ä¾à
5.4 ¸ÞÆ®·ÎÆú¸®½º - ÇìÀ̽ºÆýº ¾Ë°í¸®Áò
5.4.1 ¸ÞÆ®·ÎÆú¸®½º - ÇìÀ̽ºÆýºÀÇ º¯Çü
5.5 ºÐÇÒ »ùÇøµ
5.5.1 º¸Á¶º¯¼ö »ùÇøµ
5.5.2 ÀÚ¿¬¾î 󸮿¡¼ ºÐÇÒ »ùÇøµ°ú º¸Á¶º¯¼ö »ùÇøµ »ç¿ë¹ý
5.6 ½Ã¹Ä·¹ÀÌ¼Ç ¾î´Ò¸µ
5.7 MCMC ¾Ë°í¸®ÁòÀÇ ¼ö·Å
5.8 ¸¶¸£ÄÚÇÁ üÀÎ: ±âº» ÀÌ·Ð
5.9 MCMC ¿µ¿ª¿¡ Æ÷ÇÔµÇÁö ¾Ê´Â »ùÇøµ ¾Ë°í¸®Áò
5.10 ¸óÅ×Ä«¸¦·Î ÀûºÐ
5.11 ³íÀÇ
5.11.1 ºÐÆ÷ ÃøÁ¤ ´ë »ùÇøµ
5.11.2 ³»Æ÷ MCMC »ùÇøµ
5.11.3 MCMC »ùÇ÷¯ÀÇ ½ÇÇà ½Ã°£
5.11.4 ÆÄƼŬ ÇÊÅ͸µ
5.12 °á·Ð°ú ¿ä¾à
5.13 ¿¬½À ¹®Á¦
6Àå. º¯ºÐ Ãß·Ð
6.1 ÁÖº¯ ·Î±×¿ìµµ¿¡ ´ëÇÑ º¯ºÐ °æ°è
6.2 Æò±ÕÀå ±Ù»ç¹ý
6.3 Æò±ÕÀå º¯ºÐ Ãß·Ð ¾Ë°í¸®Áò
6.3.1 µð¸®Å¬·¹ - ´ÙÇ׺¯ºÐ Ãß·Ð
6.3.2 ±â´ñ°ª - ÃÖ´ëÈ ¾Ë°í¸®Áò°úÀÇ °ü°è
6.4 º¯ºÐ Ãß·ÐÀ» È°¿ëÇÑ °æÇèÀû º£ÀÌÁî ¹æ¹ý
6.5 ÅäÀÇ
6.5.1 Ãß·Ð ¾Ë°í¸®Áò Ãʱ⠼³Á¤
6.5.2 ¼ö·Å Áø´Ü
6.5.3 µðÄÚµùÀ» À§ÇÑ º¯ºÐ Ãß·Ð
6.5.4 KL ¹ß»ê ÃÖ¼Òȸ¦ À§ÇÑ º¯ºÐ Ãß·Ð
6.5.5 ¿Â¶óÀÎ º¯ºÐ Ãß·Ð
6.6 ¿ä¾à
6.7 ¿¬½À ¹®Á¦
7Àå. ºñ¸ð¼öÀû »çÀüºÐÆ÷
7.1 µð¸®Å¬·¹ ÇÁ·Î¼¼½º: 3°¡Áö °üÁ¡
7.1.1 ¸·´ë Àý´Ü ÇÁ·Î¼¼½º
7.1.2 Áß±¹Áý ÇÁ·Î¼¼½º
7.2 µð¸®Å¬·¹ ÇÁ·Î¼¼½º È¥ÇÕ ¸ðÇü
7.2.1 µð¸®Å¬·¹ ÇÁ·Î¼¼½º È¥ÇÕ ¸ðÇü ±â¹Ý Ãß·Ð
7.2.2 È¥ÇÕ ¸ðÇüµéÀÇ ±ØÇÑ µð¸®Å¬·¹ ÇÁ·Î¼¼½º
7.3 °èÃþÀû µð¸®Å¬·¹ ÇÁ·Î¼¼½º
7.4 ÇÇÆ®¸¸ - ¿ä¸£ ÇÁ·Î¼¼½º
7.4.1 ¾ð¾î ¸ðµ¨¸µÀ» À§ÇÑ ÇÇÆ®¸¸ - ¿ä¸£ ÇÁ·Î¼¼½º
7.4.2 ÇÇÆ®¸¸ - ¿ä¸£ ÇÁ·Î¼¼½ºÀÇ ¸è¹ýÄ¢ ¼ºÁú
7.5 ÅäÀÇ
7.5.1 °¡¿ì½Ã¾È ÇÁ·Î¼¼½º
7.5.2 Àεð¾ð ºßÆä ÇÁ·Î¼¼½º
7.5.3 ³»Æ÷ Áß±¹Áý ÇÁ·Î¼¼½º
7.5.4 °Å¸® - Á¾¼Ó Áß±¹Áý ÇÁ·Î¼¼½º
7.5.5 ½ÃÄö½º ¸Þ¸ðÀÌÀú
7.6 ¿ä¾à
7.7 ¿¬½À ¹®Á¦
8Àå. º£ÀÌÁö¾È ¹®¹ý ¸ðµ¨
8.1 º£ÀÌÁö¾È È÷µç ¸¶¸£ÄÚÇÁ ¸ðµ¨
8.1.1 ¹«ÇÑ »óÅ °ø°£¿¡¼ÀÇ È÷µç ¸¶¸£ÄÚÇÁ ¸ðµ¨
8.2 È®·üÀû ¹®¸Æ ÀÚÀ¯ ¹®¹ý
8.2.1 ´ÙÇ×ÀÇ ¸ðÀ½À¸·Î ±¸¼ºµÈ PCFG
8.2.2 PCFG¸¦ À§ÇÑ ±âº»ÀûÀÎ Ãß·Ð ¾Ë°í¸®Áò
8.2.3 PCFG °üÁ¡ÀÇ È÷µç ¸¶¸£ÄÚÇÁ ¸ðµ¨
8.3 º£ÀÌÁö¾È È®·üÀû ¹®¸Æ ÀÚÀ¯ ¹®¹ý
8.3.1 PCFG¿¡ ´ëÇÑ »çÀüºÐÆ÷
8.3.2 º£ÀÌÁö¾È PCFG¸¦ È°¿ëÇÑ ¸óÅ×Ä«¸¦·Î Ãß·Ð
8.3.3 º£ÀÌÁö¾È PCFG¸¦ È°¿ëÇÑ º¯ºÐ Ãß·Ð
8.4 ¾î´ðÅÍ ¹®¹ý
8.4.1 ÇÇÆ®¸¸ - ¿ä¸£ ¾î´ðÅÍ ¹®¹ý
8.4.2 ¸·´ë Àý´Ü °üÁ¡ÀÇ PYAG
8.4.3 PYAG¸¦ È°¿ëÇÑ Ãß·Ð
8.5 °èÃþÀû µð¸®Å¬·¹ ÇÁ·Î¼¼½º PCFGS
8.5.1 HDP - PCFG ¸ðµ¨·Î È®Àå
8.6 Á¾¼ÓÀû ¹®¹ý
8.6.1 »óÅ ºÐÇÒ ºñ¸ð¼öÀû Á¾¼Ó ¸ðµ¨
8.7 µ¿½Ã¹ß»ýÀû ¹®¹ý
8.8 ´ÙÁß ¾ð¾î ÇнÀ
8.8.1 Ç°»ç űë
8.8.2 ¹®¹ý À¯µµ
8.9 ´õ Àо±â
8.10 ¿ä¾à
8.11 ¿¬½À ¹®Á¦
9Àå. Ư¼º Ç¥Çö ÇнÀ°ú ½Å°æ¸Á
9.1 ½Å°æ¸Á ¹× Ư¼º Ç¥Çö ÇнÀ: ¿Ö Áö±ÝÀΰ¡?
9.2 ´Ü¾î ÀÓº£µù
9.2.1 ´Ü¾î ÀÓº£µùÀ» À§ÇÑ ½ºÅµ - ±×·¥ ¸ðµ¨
9.2.2 º£ÀÌÁö¾È ½ºÅµ - ±×·¥ ´Ü¾î ÀÓº£µù
9.2.3 ÅäÀÇ
9.3 ½Å°æ¸Á
9.3.1 ºóµµ·ÐÀÚ ÃßÁ¤ ¹× ¿ªÀüÆÄ ¾Ë°í¸®Áò
9.3.2 ½Å°æ¸Á °¡ÁßÄ¡¿¡ ´ëÇÑ »çÀüºÐÆ÷
9.4 Çö´ë NLP¿¡¼ÀÇ ½Å°æ¸Á È°¿ëµµ
9.4.1 Recurrent and Recursive ½Å°æ¸Á
9.4.2 °æ»çµµ ¼Ò¸ê ¹× Æø¹ß ¹®Á¦
9.4.3 ½Å°æ¸Á ±â¹Ý ÀÎÄÚ´õ - µðÄÚ´õ ¸ðµ¨
9.4.4 Convolutional Neural Networks(CNN)
9.5 ½Å°æ¸Á Á¶Á¤
9.5.1 Á¤Ä¢È
9.5.2 ÃʸŰ³º¯¼ö Á¶Á¤
9.6 ½Å°æ¸ÁÀ» ÅëÇÑ »ý¼º ¸ðµ¨¸µ
9.6.1 º¯ºÐ ¿ÀÅäÀÎÄÚ´õ
9.6.2 »ý¼º Àû´ë ½Å°æ¸Á
9.7 °á·Ð
9.8 ¿¬½À ¹®Á¦
¸ÎÀ½¸»
ºÎ·Ï A. ±âº» °³³ä
ºÎ·Ï B. ºÐÆ÷ Ä«Å»·Î±×
Âü°í¹®Çå
ã¾Æº¸±â
1.1 È®·ü ÃøÁ¤: È®·üÃøµµ, È®·üÇÔ¼ö
1.2 ¹«ÀÛÀ§ º¯¼ö
1.2.1 ¿¬¼Ó°ú ÀÌ»ê È®·ü º¯¼ö
1.2.2 ´ÙÁß·£´ýº¯¼öÀÇ °áÇÕÈ®·üºÐÆ÷
1.3 Á¶°ÇºÎºÐÆ÷
1.3.1 º£ÀÌÁî Á¤¸®
1.3.2 µ¶¸³ ±×¸®°í Á¶°ÇºÎ µ¶¸³ ·£´ýº¯¼ö
1.3.3 ±³È¯ °¡´ÉÇÑ ·£´ýº¯¼ö
1.4 ·£´ýº¯¼ö ±â´ñ°ª
1.5 ¸ðµ¨
1.5.1 ¸ð¼ö ´ë ºñ¸ð¼ö ¸ðµ¨
1.5.2 ¸ðµ¨·ÎºÎÅÍ Ãß·Ð
1.5.3 »ý¼º ¸ðµ¨
1.5.4 ¸ðµ¨ÀÇ µ¶¸³ °¡Á¤
1.5.5 ¹æÇ⼺ ±×·¡ÇÁ ¸ðµ¨
1.6 ½Ã³ª¸®¿À µ¥ÀÌÅͷκÎÅÍ ÇнÀ
1.7 º£ÀÌÁî¿Í ºóµµÁÖÀÇ Ã¶ÇÐ
1.8 ¿ä¾à
1.9 ¿¬½À ¹®Á¦
2Àå. °³¿ä
2.1 °³¿ä: º£ÀÌÁö¾È Åë°èÇаú NLPÀÇ Á¢Á¡
2.2 ù ¹ø° ¿¬½À ¹®Á¦: ÀáÀç µð¸®Å¬·¹ ÇÒ´ç ¸ðµ¨
2.2.1 µð¸®Å¬·¹ºÐÆ÷
2.2.2 Ãß·Ð
2.2.3 ¿ä¾à Á¤¸®
2.3 µÎ ¹ø° ¿¬½À ¹®Á¦: º£ÀÌÁö¾È ÅؽºÆ® ȸ±Í
2.4 °á·Ð°ú ¿ä¾à
2.5 ¿¬½À ¹®Á¦
3Àå. »çÀüÈ®·üºÐÆ÷
3.1 ÄÓ·¹»çÀüºÐÆ÷
3.1.1 ÄÓ·¹»çÀüÈ®·ü°ú Á¤±ÔÈ »ó¼ö
3.1.2 ÀáÀ纯¼ö¸ðµ¨ÀÇ ÄÓ·¹»çÀüÈ®·ü È°¿ë
3.1.3 ÄÓ·¹»çÀüÈ®·üºÐÆ÷ÀÇ È¥ÇÕ
3.1.4 ÀçÁ¤±ÔÈµÈ ÄÓ·¹ºÐÆ÷
3.1.5 ³íÀÇ: °áÇյǰųª °áÇÕµÇÁö ¾Ê´Â´Ù?
3.1.6 ¿ä¾à
3.2 ´ÙÇ׺ÐÆ÷¿Í Ä«Å×°í¸®ºÐÆ÷¿¡ ´ëÇÑ »çÀüÈ®·ü
3.2.1 µð¸®Å¬·¹ºÐÆ÷ ¸®ºä
3.2.2 ·ÎÁö½ºÆ½Á¤±ÔºÐÆ÷
3.2.3 ³íÀÇ
3.2.4 ¿ä¾à
3.3 ºñ - Á¤º¸¼º »çÀüÈ®·üºÐÆ÷
3.3.1 UNIFORM AND IMPROPER PRIORS
3.3.2 Jeffreys Prior
3.3.3 DISCUSSION
3.4 CONJUGACY AND EXPONENTIAL MODELS
3.5 ¸ðµ¨ÀÌ °®´Â ´ÙÁß ÆĶó¹ÌÅÍ
3.6 ±¸Á¶Àû »çÀüÈ®·üºÐÆ÷
3.7 °á·Ð ¹× Á¤¸®
3.8 ¿¬½À ¹®Á¦
4Àå. º£ÀÌÁî ÃßÁ¤
4.1 ÀáÀ纯¼ö¸¦ ÅëÇØ ¹è¿ö º¼ µÎ °¡Áö °üÁ¡
4.2 º£ÀÌÁö¾È Á¡ ÃßÁ¤
4.2.1 ÃÖ´ë »çÈÄÈ®·ü ÃßÁ¤ ¹æ¹ý
4.2.2 ÃÖ´ë»çÈÄÈ®·ü¹æ¹ý¿¡ µû¸¥ »çÈÄÈ®·üºÐÆ÷ ±Ù»ç
4.2.3 °áÁ¤ÀÌ·Ð Á¡ ÃßÁ¤Ä¡
4.2.4 Á¤¸®
4.3 ½ÇÇèÀû º£ÀÌÁî Á¤¸®
4.4 »çÈÄÈ®·üºÐÆ÷ÀÇ Á¡±ÙÀû Çൿ
4.5 ¿ä¾à
4.6 ¿¬½À ¹®Á¦
5Àå. »ùÇøµ(Ç¥Áý) ¹æ¹ý
5.1 MCMC ¾Ë°í¸®Áò: °³¿ä
5.2 MCMC Ãß·ÐÀ» À§ÇÑ ÀÚ¿¬¾î ó¸® ¸ðµ¨ ±¸Á¶
5.2.1 ÀáÀ纯¼ö ºÐÇÒ¹ý
5.3 ±é½º »ùÇøµ
5.3.1 Ãà¼ÒµÈ ±é½º »ùÇøµ
5.3.2 ¿¬»êÀÚ °üÁ¡
5.3.3 ±é½º »ùÇ÷¯ º´·ÄÈ
5.3.4 ¿ä¾à
5.4 ¸ÞÆ®·ÎÆú¸®½º - ÇìÀ̽ºÆýº ¾Ë°í¸®Áò
5.4.1 ¸ÞÆ®·ÎÆú¸®½º - ÇìÀ̽ºÆýºÀÇ º¯Çü
5.5 ºÐÇÒ »ùÇøµ
5.5.1 º¸Á¶º¯¼ö »ùÇøµ
5.5.2 ÀÚ¿¬¾î 󸮿¡¼ ºÐÇÒ »ùÇøµ°ú º¸Á¶º¯¼ö »ùÇøµ »ç¿ë¹ý
5.6 ½Ã¹Ä·¹ÀÌ¼Ç ¾î´Ò¸µ
5.7 MCMC ¾Ë°í¸®ÁòÀÇ ¼ö·Å
5.8 ¸¶¸£ÄÚÇÁ üÀÎ: ±âº» ÀÌ·Ð
5.9 MCMC ¿µ¿ª¿¡ Æ÷ÇÔµÇÁö ¾Ê´Â »ùÇøµ ¾Ë°í¸®Áò
5.10 ¸óÅ×Ä«¸¦·Î ÀûºÐ
5.11 ³íÀÇ
5.11.1 ºÐÆ÷ ÃøÁ¤ ´ë »ùÇøµ
5.11.2 ³»Æ÷ MCMC »ùÇøµ
5.11.3 MCMC »ùÇ÷¯ÀÇ ½ÇÇà ½Ã°£
5.11.4 ÆÄƼŬ ÇÊÅ͸µ
5.12 °á·Ð°ú ¿ä¾à
5.13 ¿¬½À ¹®Á¦
6Àå. º¯ºÐ Ãß·Ð
6.1 ÁÖº¯ ·Î±×¿ìµµ¿¡ ´ëÇÑ º¯ºÐ °æ°è
6.2 Æò±ÕÀå ±Ù»ç¹ý
6.3 Æò±ÕÀå º¯ºÐ Ãß·Ð ¾Ë°í¸®Áò
6.3.1 µð¸®Å¬·¹ - ´ÙÇ׺¯ºÐ Ãß·Ð
6.3.2 ±â´ñ°ª - ÃÖ´ëÈ ¾Ë°í¸®Áò°úÀÇ °ü°è
6.4 º¯ºÐ Ãß·ÐÀ» È°¿ëÇÑ °æÇèÀû º£ÀÌÁî ¹æ¹ý
6.5 ÅäÀÇ
6.5.1 Ãß·Ð ¾Ë°í¸®Áò Ãʱ⠼³Á¤
6.5.2 ¼ö·Å Áø´Ü
6.5.3 µðÄÚµùÀ» À§ÇÑ º¯ºÐ Ãß·Ð
6.5.4 KL ¹ß»ê ÃÖ¼Òȸ¦ À§ÇÑ º¯ºÐ Ãß·Ð
6.5.5 ¿Â¶óÀÎ º¯ºÐ Ãß·Ð
6.6 ¿ä¾à
6.7 ¿¬½À ¹®Á¦
7Àå. ºñ¸ð¼öÀû »çÀüºÐÆ÷
7.1 µð¸®Å¬·¹ ÇÁ·Î¼¼½º: 3°¡Áö °üÁ¡
7.1.1 ¸·´ë Àý´Ü ÇÁ·Î¼¼½º
7.1.2 Áß±¹Áý ÇÁ·Î¼¼½º
7.2 µð¸®Å¬·¹ ÇÁ·Î¼¼½º È¥ÇÕ ¸ðÇü
7.2.1 µð¸®Å¬·¹ ÇÁ·Î¼¼½º È¥ÇÕ ¸ðÇü ±â¹Ý Ãß·Ð
7.2.2 È¥ÇÕ ¸ðÇüµéÀÇ ±ØÇÑ µð¸®Å¬·¹ ÇÁ·Î¼¼½º
7.3 °èÃþÀû µð¸®Å¬·¹ ÇÁ·Î¼¼½º
7.4 ÇÇÆ®¸¸ - ¿ä¸£ ÇÁ·Î¼¼½º
7.4.1 ¾ð¾î ¸ðµ¨¸µÀ» À§ÇÑ ÇÇÆ®¸¸ - ¿ä¸£ ÇÁ·Î¼¼½º
7.4.2 ÇÇÆ®¸¸ - ¿ä¸£ ÇÁ·Î¼¼½ºÀÇ ¸è¹ýÄ¢ ¼ºÁú
7.5 ÅäÀÇ
7.5.1 °¡¿ì½Ã¾È ÇÁ·Î¼¼½º
7.5.2 Àεð¾ð ºßÆä ÇÁ·Î¼¼½º
7.5.3 ³»Æ÷ Áß±¹Áý ÇÁ·Î¼¼½º
7.5.4 °Å¸® - Á¾¼Ó Áß±¹Áý ÇÁ·Î¼¼½º
7.5.5 ½ÃÄö½º ¸Þ¸ðÀÌÀú
7.6 ¿ä¾à
7.7 ¿¬½À ¹®Á¦
8Àå. º£ÀÌÁö¾È ¹®¹ý ¸ðµ¨
8.1 º£ÀÌÁö¾È È÷µç ¸¶¸£ÄÚÇÁ ¸ðµ¨
8.1.1 ¹«ÇÑ »óÅ °ø°£¿¡¼ÀÇ È÷µç ¸¶¸£ÄÚÇÁ ¸ðµ¨
8.2 È®·üÀû ¹®¸Æ ÀÚÀ¯ ¹®¹ý
8.2.1 ´ÙÇ×ÀÇ ¸ðÀ½À¸·Î ±¸¼ºµÈ PCFG
8.2.2 PCFG¸¦ À§ÇÑ ±âº»ÀûÀÎ Ãß·Ð ¾Ë°í¸®Áò
8.2.3 PCFG °üÁ¡ÀÇ È÷µç ¸¶¸£ÄÚÇÁ ¸ðµ¨
8.3 º£ÀÌÁö¾È È®·üÀû ¹®¸Æ ÀÚÀ¯ ¹®¹ý
8.3.1 PCFG¿¡ ´ëÇÑ »çÀüºÐÆ÷
8.3.2 º£ÀÌÁö¾È PCFG¸¦ È°¿ëÇÑ ¸óÅ×Ä«¸¦·Î Ãß·Ð
8.3.3 º£ÀÌÁö¾È PCFG¸¦ È°¿ëÇÑ º¯ºÐ Ãß·Ð
8.4 ¾î´ðÅÍ ¹®¹ý
8.4.1 ÇÇÆ®¸¸ - ¿ä¸£ ¾î´ðÅÍ ¹®¹ý
8.4.2 ¸·´ë Àý´Ü °üÁ¡ÀÇ PYAG
8.4.3 PYAG¸¦ È°¿ëÇÑ Ãß·Ð
8.5 °èÃþÀû µð¸®Å¬·¹ ÇÁ·Î¼¼½º PCFGS
8.5.1 HDP - PCFG ¸ðµ¨·Î È®Àå
8.6 Á¾¼ÓÀû ¹®¹ý
8.6.1 »óÅ ºÐÇÒ ºñ¸ð¼öÀû Á¾¼Ó ¸ðµ¨
8.7 µ¿½Ã¹ß»ýÀû ¹®¹ý
8.8 ´ÙÁß ¾ð¾î ÇнÀ
8.8.1 Ç°»ç űë
8.8.2 ¹®¹ý À¯µµ
8.9 ´õ Àо±â
8.10 ¿ä¾à
8.11 ¿¬½À ¹®Á¦
9Àå. Ư¼º Ç¥Çö ÇнÀ°ú ½Å°æ¸Á
9.1 ½Å°æ¸Á ¹× Ư¼º Ç¥Çö ÇнÀ: ¿Ö Áö±ÝÀΰ¡?
9.2 ´Ü¾î ÀÓº£µù
9.2.1 ´Ü¾î ÀÓº£µùÀ» À§ÇÑ ½ºÅµ - ±×·¥ ¸ðµ¨
9.2.2 º£ÀÌÁö¾È ½ºÅµ - ±×·¥ ´Ü¾î ÀÓº£µù
9.2.3 ÅäÀÇ
9.3 ½Å°æ¸Á
9.3.1 ºóµµ·ÐÀÚ ÃßÁ¤ ¹× ¿ªÀüÆÄ ¾Ë°í¸®Áò
9.3.2 ½Å°æ¸Á °¡ÁßÄ¡¿¡ ´ëÇÑ »çÀüºÐÆ÷
9.4 Çö´ë NLP¿¡¼ÀÇ ½Å°æ¸Á È°¿ëµµ
9.4.1 Recurrent and Recursive ½Å°æ¸Á
9.4.2 °æ»çµµ ¼Ò¸ê ¹× Æø¹ß ¹®Á¦
9.4.3 ½Å°æ¸Á ±â¹Ý ÀÎÄÚ´õ - µðÄÚ´õ ¸ðµ¨
9.4.4 Convolutional Neural Networks(CNN)
9.5 ½Å°æ¸Á Á¶Á¤
9.5.1 Á¤Ä¢È
9.5.2 ÃʸŰ³º¯¼ö Á¶Á¤
9.6 ½Å°æ¸ÁÀ» ÅëÇÑ »ý¼º ¸ðµ¨¸µ
9.6.1 º¯ºÐ ¿ÀÅäÀÎÄÚ´õ
9.6.2 »ý¼º Àû´ë ½Å°æ¸Á
9.7 °á·Ð
9.8 ¿¬½À ¹®Á¦
¸ÎÀ½¸»
ºÎ·Ï A. ±âº» °³³ä
ºÎ·Ï B. ºÐÆ÷ Ä«Å»·Î±×
Âü°í¹®Çå
ã¾Æº¸±â
[ÀÌ Ã¥ÀÇ ±¸¼º]
1ÀåÀº º£ÀÌÁî ÀÚ¿¬¾î ó¸®¿Í °ü·ÃµÈ È®·ü°ú Åë°è¿¡ ´ëÇÑ ³»¿ëÀ» ´Ù·é´Ù. ·£´ýº¯¼ö, ·£´ýº¯¼ö °£ÀÇ µ¶¸³¼º, Á¶°ÇºÎ µ¶¸³¼º ·£´ýº¯¼ö ±â´ñ°ª µî°ú °°Àº ±âº»Àû °³³äÀ» ´Ù·é´Ù. ¶ÇÇÑ º£ÀÌÁî Åë°èÇаú ºóµµÁÖÀÇ Åë°èÇÐÀÌ ¾î¶»°Ô ´Ù¸¥Áö °£·«ÇÏ°Ô ¼³¸íÇÑ´Ù. ÄÄÇ»ÅÍ °úÇÐÀ̳ª Åë°èÇÐÀÇ ±âº»ÀûÀÎ Áö½ÄÀÌ ÀÖ´Ù¸é 1ÀåÀ» °Ç³Ê¶Ù°í ºÁµµ ÁÁ´Ù. 2Àå¿¡¼´Â 2°¡Áö ¿¹½Ã(ÀáÀç µð¸®Å¬·¹ ÇÒ´ç ¸ðµ¨°ú º£ÀÌÁî ÅؽºÆ® ȸ±Í ºÐ¼®)¸¦ È°¿ëÇØ ÀÚ¿¬¾î 󸮿¡¼ º£ÀÌÁî ºÐ¼®À» ¼Ò°³ÇÏ°í, ÀÌ Ã¥ÀÇ ÁÖÁ¦¿¡ ´ëÇÑ ³ôÀº ¼öÁØÀÇ °³¿ä¸¦ ¼³¸íÇÑ´Ù.
3ÀåÀº º£ÀÌÁî Åë°è ¸ðµ¨¸µ¿¡¼ Áß¿äÇÑ ±¸¼º ¿ä¼ÒÀÎ »çÀüºÐÆ÷¸¦ ´Ù·é´Ù. ƯÈ÷ µð¸®Å¬·¹ºÐÆ÷, »çÀüºÐÆ÷¿¡ ´ëÇÑ Á¤º¸°¡ ¾ø´Â °æ¿ì, Á¤±ÔºÐÆ÷ µî°ú °°ÀÌ º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡ ÀÚÁÖ »ç¿ëµÇ´Â »çÀüºÐÆ÷¿¡ ´ëÇÑ ³»¿ëÀ» ³íÇÑ´Ù. 4ÀåÀº »çÈĺÐÆ÷ ¿ä¾àÀ» ÅëÇØ ºóµµÁÖÀÇÀû Åë°è¿Í º£ÀÌÁî Åë°è¸¦ Á¾ÇÕÇÏ´Â ¾ÆÀ̵ð¾î¿¡ ´ëÇØ ´Ù·é´Ù. ¶ÇÇÑ º£ÀÌÁî¿¡ °üÇÑ °³³äÀ» À¯ÁöÇÑ »óÅ·Î, ÀÏ·ÃÀÇ ¸Å°³º¯¼ö¿¡ ´ëÇÑ Á¡ ÃßÁ¤Ä¡¸¦ °è»êÇÏ´Â Á¢±Ù¹ýÀ» »ó¼¼ÇÏ°Ô ¼³¸íÇÑ´Ù.
5ÀåÀº º£ÀÌÁî Åë°èÇÐÀÇ ÁÖ¿ä Ã߷йý Áß ÇϳªÀÎ ¸¶¸£ÄÚÇÁ üÀÎ ¸óÅ× Ä«¸¦·Î(Markov Chain Monte Carolo)¸¦ ¼³¸íÇÑ´Ù. ±é½º »ùÇøµ°ú ¸ÞÆ®·ÎÆú¸®½º-ÇìÀ̽ºÆýº »ùÇøµ(Metropolis-Hastings sampling)°ú °°Àº º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡¼ ÈçÇÏ°Ô ´Ù·ç´Â »ùÇøµ ¾Ë°í¸®Áò(sampling algorithm)À» ÀÚ¼¼ÇÏ°Ô ¾Ë·ÁÁØ´Ù. 6Àå¿¡¼´Â º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡¼ ¶Ç ´Ù¸¥ Áß¿äÇÑ Ã߷йýÀ¸·Î ¿©°ÜÁö´Â º¯ºÐÃß·ÐÀ» ´Ù·é´Ù. Æò±Õ-Àå º¯ºÐÃ߷аú º¯ºÐ ±â´ñ°ª ÃÖ´ëÈ ¾Ë°í¸®ÁòÀ» ¼³¸íÇÑ´Ù.
7ÀåÀº º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡¼ °¡Àå Áß¿äÇÑ ¸ðµ¨¸µ ±â¹ýÀÎ ºñ¸ð¼öÀû ¸ðµ¨¸µ¿¡ ´ëÇØ ¼³¸íÇÑ´Ù. ¶ÇÇÑ µð¸®Å¬·¹ ÇÁ·Î¼¼½º(Dirichlet Process)¿Í ÇÇÆ®¸¸-¿ä ÇÁ·Î¼¼½º(Pitman-Yor process)¿Í °°Àº ºñ¸ð¼ö ¸ðµ¨À» »ìÆ캻´Ù. 8Àå¿¡¼´Â È®·ü·ÐÀû ¹®¸Æ ÀÚÀ¯ ¹®¹ý°ú µ¿½Ã¼º ¹®¹ý°ú °°Àº ÀÚ¿¬¾î ó¸® ±âº» ¾ð¾î ¸ðµ¨À» ´Ù°í, ÀÌ·¯ÇÑ ¾ð¾î ¸ðµ¨À» ¾î´ðÅÍ ¹®¹ý, °èÃþÀû µð¸®Å¬·¹ ÇÁ·Î¼¼½º, PCFG(Probabilistic Context-Free Grammars) µî°ú ¿¬°üÁö¾î º£ÀÌÁî ³»¿ëÀ» ¹ÙÅÁÀ¸·Î ¼³¸íÇÑ´Ù.
¶ÇÇÑ Ã¥ÀÇ µÞºÎºÐ¿¡´Â ÀÌ Ã¥À» Àбâ À§ÇØ ÇÊ¿äÇÑ ¹è°æ Á¤º¸¸¦ Á¦°øÇÏ´Â µÎ °³ÀÇ ºÎ·ÏÀÌ Æ÷ÇԵŠÀÖ´Ù. 5°³ ÀÌ»óÀÇ ¹®Á¦°¡ °¢ À帶´Ù Æ÷ÇԵŠÀÖ¾î ¼ö¾÷ ±³Àç·Î È°¿ëÇÒ ¼öµµ ÀÖ´Ù. ƯÈ÷ ÀÚ¿¬¾î 󸮿¡¼ º£ÀÌÁî ºÐ¼®¿¡ ´ëÇÑ °ÀǸ¦ ÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù. ¿¹¸¦ µé¾î º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ °ÀǸ¦ 4¹ø Á¤µµ ÇÑ´Ù¸é, 3ÀåºÎÅÍ 7ÀåÀ» °¢°¢ ÇϳªÀÇ °ÀÇ·Î ¿«À» ¼ö ÀÖ´Ù. ¶ÇÇÑ 8ÀåÀÇ ¾î´ðÅÍ ¹®¹ý ¶Ç´Â º£ÀÌÁî PCFG µî°ú °°Àº °³º° ÁÖÁ¦µéÀº °¢ °ÀǸ¶´Ù ¿¹½Ã·Î Á¦°øÇÒ ¼ö ÀÖ´Ù.
[ÁöÀºÀÌÀÇ ¸»]
º£ÀÌÁî Åë°èÇÐ(Bayesian Statistics)°ú ÀÚ¿¬¾î ó¸®(Natural Language Processing) µÎ ÁÖÁ¦¸¦ ±³Â÷ÇÏ´Â ÁÖÁ¦¿¡ °üÇØ ±ÛÀ» ¾µ ¶§, °¢ ºÐ¾ß¿¡ ´ëÇÑ °üÁ¡À» °í·ÁÇØ¾ß ÇÑ´Ù. ´ëÇпø ÀçÇÐ ½ÃÀý, ³ª¿Í ºñ½ÁÇÑ »óȲ¿¡ ÀÖ´Â »ç¶÷µéÀ» À§ÇØ ´Ù¼Ò ½Ç¿ëÀûÀÎ °üÁ¡¿¡¼ Ã¥À» ÁýÇÊÇß´Ù. ±×¶§´Â ÀÌ¹Ì ÀÚ¿¬¾î ó¸® ºÐ¾ßÀÇ ¹®Á¦¿Í ¸Ó½Å·¯´×ÀÇ ±âº» ¿ø¸®¿¡ ´ëÇÑ Áö½ÄÀ» ÇÕ¸®ÀûÀ¸·Î ÆľÇÇÏ°í ÀÖ¾ú´Ù. ³ª´Â Ãß»óÀûÀÎ ¹æ¹ýÀ¸·Î¶óµµ º£ÀÌÁî Åë°èÇÐ, ƯÈ÷ ÀÚ¿¬¾î ó¸®¿Í °ü·ÃµÈ ºÎºÐ¿¡ ´ëÇØ ´õ ¹è¿ì°í ½Í¾ú´Ù. µû¶ó¼ ÀÌ Ã¥Àº Àü»ê ¾ð¾îÇÐÀÚµéÀÌ º£ÀÌÁî Á¢±Ù¹ýÀ» Àû¿ëÇÒ ¶§ ÇÊ¿äÇÑ ÁÖ¿ä ±â¼ú, ¿ë¾î ¹× ¸ðµ¨¿¡ ´ëÇÑ Ãß»óÀûÀÎ Á¤º¸¸¦ Á¦°øÇÏ´Â °üÁ¡¿¡¼ ½è´Ù. ±×·¯¹Ç·Î ÀÌ Ã¥ÀÇ ´ëºÎºÐÀÇ ÀåÀº ´Ù¼Ò ÀϹÝÀûÀÌ°í º£ÀÌÁî Åë°èÇаú ¹ÐÁ¢ÇÑ °ü·ÃÀÌ ÀÖ´Ù. ±×·¯³ª ¸¶Áö¸· Àå¿¡¼´Â ¾ð¾î ¸ðµ¨À» À§ÇØ ÁÖ·Î »ç¿ëµÇ´Â ¸î¸î ÀÚ¿¬¾î 󸮸¦ ÀÀ¿ë¹ýÀ» ¼Ò°³ÇÑ´Ù.
ÀÌ Ã¥Àº ÀÚ¿¬¾î ó¸®ÀÇ Åë°è ¸ðµ¨¸µ¿¡ ´ëÇØ ÀÌ¹Ì ¾î´À Á¤µµ ¾Ë°í ÀÖ´Â »ç¶÷µé°ú, ÀÚ¿¬¾î 󸮿¡¼ º£ÀÌÁî Åë°èÇÐÀÌ Æ¯È÷ ¾î¶»°Ô »ç¿ëµÇ´ÂÁö ´õ ÀÚ¼¼È÷ ¾Ë°í ½ÍÀº »ç¶÷µéÀ» À§ÇÑ Ã¥ÀÌ´Ù. º£ÀÌÁî ÀÚ¿¬¾î ó¸®ÀÇ ¼öÇÐÀûÀÎ Çؼ®¿¡ ´ëÇØ ´õ ÃÊÁ¡À» ¸ÂÃß°Ô µÈ µ¿±â´Â ¸Å¿ì °£´ÜÇÏ´Ù. ´ëºÎºÐÀÇ Àü»ê ¾ð¾îÇÐÀÚµéÀº ¾ð¾î ±¸Á¶¸¦ ¿¹ÃøÇϰųª, ¾ð¾îÇÐÀû µ¿±âºÎ¿©¸¦ ÀÏÀ¸Å°´Â ÀÚ¿¬¾î ó¸®ÀÇ ±âÃÊ ÇÙ½É ¿ë¾î¿¡ »ý°¢º¸´Ù ÀÏÂï ³ëÃâµÈ´Ù. Á¾Á¾ º£ÀÌÁî Åë°èÇаú ´Ù¸¥ Åë°èÇÐ µµ±¸µé¿¡ ´ëÇØ ±íÀÌ ÀÌÇØÇÏÁö ¸øÇÏ°í ³õÄ¡°Ô µÇ´Âµ¥, ÀÌ·Î ÀÎÇØ ¶§¶§·Î ¿ÀÇØ°¡ »ý±â°í Å« ±×¸²À» ³õÄ¡´Â °æ¿ì°¡ ¹ß»ýÇÑ´Ù. ÀÌ Ã¥Àº µ¶ÀÚµéÀÌ ³õÄ¥ ¼ö ÀÖ´Â ºÎºÐµéÀ» ÀÚ¼¼ÇÏ°Ô ¼³¸íÇØÁÙ °ÍÀÌ´Ù.
³»°¡ óÀ½ ÇÙ½É ¾ÆÀ̵ð¾î¸¦ Á¢ÇßÀ» ¶§, º£ÀÌÁî Åë°èÇÐÀÇ ¼öÇÐÀû ¶Ù¾î³²°ú ¿ì¾ÆÇÔ µî¿¡ ¸Å·áµÆÁö¸¸(¿øÄ¢ÀûÀ¸·Î º£ÀÌÁî Åë°èÇÐÀº µ¥ÀÌÅÍ¿Í ¸Å°³º¯¼ö »çÀÌ °ü°è¸¦ ¹ÝÀü½ÃÅ°±â À§ÇÑ º£ÀÌÁî ±ÔÄ¢À» Àû¿ëÇÏ´Â ÇϳªÀÇ Æ¯Á¤ ¿ø¸®¸¦ ±â¹ÝÀ¸·Î ÇÑ´Ù), ÀÌ Ã¥¿¡¼´Â ½Ç¿ëÀûÀÎ Á¢±Ù¹ýÀ» ÃëÇÏ¸ç º£ÀÌÁî Åë°èÇÐÀÌ ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ Åë°èÇÐÀû ºÐ¼®À» ±Ã±ØÀûÀÎ ÀÌ·ÐÀ¸·Î Á¦½ÃÇÏ·Á°í ÇÏÁö ¾Ê¾Ò´Ù. ±×¸®°í º£ÀÌÁî Åë°èÇÐÀ» ¼³¸íÇÒ ¼ö ÀÖ´Â ¶Ç ´Ù¸¥ öÇÐÀû ÁÖÀåÀ» Á¦½ÃÇÏÁö ¾Ê¾Ò´Ù. ´ë½Å¿¡ º£ÀÌÁî Åë°èÇÐÀÇ µÞ¹ÞħÀÌ µÇ´Â ±â¼úÀû ¸ÞÄ¿´ÏÁòÀ» ¼³¸íÇÏ°í, µ¶ÀÚµéÀÌ ÀÚ¿¬¾î ó¸® ¹®Á¦¿¡¼ ´õ ÁÁÀº ¹æ¹ý·ÐÀ» ¼±ÅÃÇÒ ¼ö ÀÖµµ·Ï µµ¿ÍÁÙ °ÍÀÌ´Ù. ¶ÇÇÑ º£ÀÌÁî Åë°èÇаú ºóµµÁÖÀÇÀû Á¢±Ù¹ý°úÀÇ °ü°è, ¾Æ¿ï·¯ ±× ¹ÛÀÇ ´Ù¸¥ ºÎºÐ°ú °áÇյǴ ºÎºÐµµ ¼³¸íÇÑ´Ù.
[¿Å±äÀÌÀÇ ¸»]
ÀΰøÁö´É ±â¼úÀÌ ¹ßÀüÇÏ¸é¼ ºñ¾àÀûÀÎ ¼ºÀåÀ» ÀÌ·ç°í ÀÖ´Â ÀÚ¿¬¾î ó¸® ºÐ¾ß¿¡ °ü·ÃµÈ Ã¥ÀÌ´Ù. ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ ÀϹÝÀûÀÎ ³»¿ëÀ» ÀÌÇØÇÏ°í ÀÖ´Ù¸é º£ÀÌÁö¾ÈÀ» È°¿ëÇÑ Á¢±ÙÀ» ÅëÇØ ÀÚ¿¬¾î 󸮸¦ »õ·Î¿î ½Ã°¢¿¡¼ ¹Ù¶óº¼ ¼ö ÀÖÀ» °ÍÀÌ´Ù. Åë°è °³³äÀÌ ¸¹ÀÌ µîÀåÇÏ°í ´Ù¼Ò ¾î·Æ°Ô ´À²¸Áú ¼ö´Â ÀÖÀ¸³ª, Åë°èÀûÀÎ ÃßÁ¤¿¡ ±Ù°ÅÇÑ ÀÚ¿¬¾î 󸮴 ¾î¶² ¸ð½ÀÀÌ°í ¾î¶»°Ô ¿¬±¸µÇ°í ÀÖ´ÂÁö Á¢ÇÒ ¼ö ÀÖ´Ù. ÁÖÁ¦¿Í ³»¿ëÀº ¾î·Á¿ï ¼ö ÀÖÁö¸¸ ÀúÀÚ°¡ ÃÖ´ëÇÑ ½±°Ô ¼³¸íÇÏ·Á°í ÇßÀ¸¸ç, ³ª ¶ÇÇÑ ÀúÀÚÀÇ Àǵµ¿¡ µû¶ó ÀÌÇØÇϱ⠽±°Ô ¹ø¿ªÇÏ·Á°í ³ë·ÂÇß´Ù.
1ÀåÀº º£ÀÌÁî ÀÚ¿¬¾î ó¸®¿Í °ü·ÃµÈ È®·ü°ú Åë°è¿¡ ´ëÇÑ ³»¿ëÀ» ´Ù·é´Ù. ·£´ýº¯¼ö, ·£´ýº¯¼ö °£ÀÇ µ¶¸³¼º, Á¶°ÇºÎ µ¶¸³¼º ·£´ýº¯¼ö ±â´ñ°ª µî°ú °°Àº ±âº»Àû °³³äÀ» ´Ù·é´Ù. ¶ÇÇÑ º£ÀÌÁî Åë°èÇаú ºóµµÁÖÀÇ Åë°èÇÐÀÌ ¾î¶»°Ô ´Ù¸¥Áö °£·«ÇÏ°Ô ¼³¸íÇÑ´Ù. ÄÄÇ»ÅÍ °úÇÐÀ̳ª Åë°èÇÐÀÇ ±âº»ÀûÀÎ Áö½ÄÀÌ ÀÖ´Ù¸é 1ÀåÀ» °Ç³Ê¶Ù°í ºÁµµ ÁÁ´Ù. 2Àå¿¡¼´Â 2°¡Áö ¿¹½Ã(ÀáÀç µð¸®Å¬·¹ ÇÒ´ç ¸ðµ¨°ú º£ÀÌÁî ÅؽºÆ® ȸ±Í ºÐ¼®)¸¦ È°¿ëÇØ ÀÚ¿¬¾î 󸮿¡¼ º£ÀÌÁî ºÐ¼®À» ¼Ò°³ÇÏ°í, ÀÌ Ã¥ÀÇ ÁÖÁ¦¿¡ ´ëÇÑ ³ôÀº ¼öÁØÀÇ °³¿ä¸¦ ¼³¸íÇÑ´Ù.
3ÀåÀº º£ÀÌÁî Åë°è ¸ðµ¨¸µ¿¡¼ Áß¿äÇÑ ±¸¼º ¿ä¼ÒÀÎ »çÀüºÐÆ÷¸¦ ´Ù·é´Ù. ƯÈ÷ µð¸®Å¬·¹ºÐÆ÷, »çÀüºÐÆ÷¿¡ ´ëÇÑ Á¤º¸°¡ ¾ø´Â °æ¿ì, Á¤±ÔºÐÆ÷ µî°ú °°ÀÌ º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡ ÀÚÁÖ »ç¿ëµÇ´Â »çÀüºÐÆ÷¿¡ ´ëÇÑ ³»¿ëÀ» ³íÇÑ´Ù. 4ÀåÀº »çÈĺÐÆ÷ ¿ä¾àÀ» ÅëÇØ ºóµµÁÖÀÇÀû Åë°è¿Í º£ÀÌÁî Åë°è¸¦ Á¾ÇÕÇÏ´Â ¾ÆÀ̵ð¾î¿¡ ´ëÇØ ´Ù·é´Ù. ¶ÇÇÑ º£ÀÌÁî¿¡ °üÇÑ °³³äÀ» À¯ÁöÇÑ »óÅ·Î, ÀÏ·ÃÀÇ ¸Å°³º¯¼ö¿¡ ´ëÇÑ Á¡ ÃßÁ¤Ä¡¸¦ °è»êÇÏ´Â Á¢±Ù¹ýÀ» »ó¼¼ÇÏ°Ô ¼³¸íÇÑ´Ù.
5ÀåÀº º£ÀÌÁî Åë°èÇÐÀÇ ÁÖ¿ä Ã߷йý Áß ÇϳªÀÎ ¸¶¸£ÄÚÇÁ üÀÎ ¸óÅ× Ä«¸¦·Î(Markov Chain Monte Carolo)¸¦ ¼³¸íÇÑ´Ù. ±é½º »ùÇøµ°ú ¸ÞÆ®·ÎÆú¸®½º-ÇìÀ̽ºÆýº »ùÇøµ(Metropolis-Hastings sampling)°ú °°Àº º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡¼ ÈçÇÏ°Ô ´Ù·ç´Â »ùÇøµ ¾Ë°í¸®Áò(sampling algorithm)À» ÀÚ¼¼ÇÏ°Ô ¾Ë·ÁÁØ´Ù. 6Àå¿¡¼´Â º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡¼ ¶Ç ´Ù¸¥ Áß¿äÇÑ Ã߷йýÀ¸·Î ¿©°ÜÁö´Â º¯ºÐÃß·ÐÀ» ´Ù·é´Ù. Æò±Õ-Àå º¯ºÐÃ߷аú º¯ºÐ ±â´ñ°ª ÃÖ´ëÈ ¾Ë°í¸®ÁòÀ» ¼³¸íÇÑ´Ù.
7ÀåÀº º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡¼ °¡Àå Áß¿äÇÑ ¸ðµ¨¸µ ±â¹ýÀÎ ºñ¸ð¼öÀû ¸ðµ¨¸µ¿¡ ´ëÇØ ¼³¸íÇÑ´Ù. ¶ÇÇÑ µð¸®Å¬·¹ ÇÁ·Î¼¼½º(Dirichlet Process)¿Í ÇÇÆ®¸¸-¿ä ÇÁ·Î¼¼½º(Pitman-Yor process)¿Í °°Àº ºñ¸ð¼ö ¸ðµ¨À» »ìÆ캻´Ù. 8Àå¿¡¼´Â È®·ü·ÐÀû ¹®¸Æ ÀÚÀ¯ ¹®¹ý°ú µ¿½Ã¼º ¹®¹ý°ú °°Àº ÀÚ¿¬¾î ó¸® ±âº» ¾ð¾î ¸ðµ¨À» ´Ù°í, ÀÌ·¯ÇÑ ¾ð¾î ¸ðµ¨À» ¾î´ðÅÍ ¹®¹ý, °èÃþÀû µð¸®Å¬·¹ ÇÁ·Î¼¼½º, PCFG(Probabilistic Context-Free Grammars) µî°ú ¿¬°üÁö¾î º£ÀÌÁî ³»¿ëÀ» ¹ÙÅÁÀ¸·Î ¼³¸íÇÑ´Ù.
¶ÇÇÑ Ã¥ÀÇ µÞºÎºÐ¿¡´Â ÀÌ Ã¥À» Àбâ À§ÇØ ÇÊ¿äÇÑ ¹è°æ Á¤º¸¸¦ Á¦°øÇÏ´Â µÎ °³ÀÇ ºÎ·ÏÀÌ Æ÷ÇԵŠÀÖ´Ù. 5°³ ÀÌ»óÀÇ ¹®Á¦°¡ °¢ À帶´Ù Æ÷ÇԵŠÀÖ¾î ¼ö¾÷ ±³Àç·Î È°¿ëÇÒ ¼öµµ ÀÖ´Ù. ƯÈ÷ ÀÚ¿¬¾î 󸮿¡¼ º£ÀÌÁî ºÐ¼®¿¡ ´ëÇÑ °ÀǸ¦ ÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù. ¿¹¸¦ µé¾î º£ÀÌÁî ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ °ÀǸ¦ 4¹ø Á¤µµ ÇÑ´Ù¸é, 3ÀåºÎÅÍ 7ÀåÀ» °¢°¢ ÇϳªÀÇ °ÀÇ·Î ¿«À» ¼ö ÀÖ´Ù. ¶ÇÇÑ 8ÀåÀÇ ¾î´ðÅÍ ¹®¹ý ¶Ç´Â º£ÀÌÁî PCFG µî°ú °°Àº °³º° ÁÖÁ¦µéÀº °¢ °ÀǸ¶´Ù ¿¹½Ã·Î Á¦°øÇÒ ¼ö ÀÖ´Ù.
[ÁöÀºÀÌÀÇ ¸»]
º£ÀÌÁî Åë°èÇÐ(Bayesian Statistics)°ú ÀÚ¿¬¾î ó¸®(Natural Language Processing) µÎ ÁÖÁ¦¸¦ ±³Â÷ÇÏ´Â ÁÖÁ¦¿¡ °üÇØ ±ÛÀ» ¾µ ¶§, °¢ ºÐ¾ß¿¡ ´ëÇÑ °üÁ¡À» °í·ÁÇØ¾ß ÇÑ´Ù. ´ëÇпø ÀçÇÐ ½ÃÀý, ³ª¿Í ºñ½ÁÇÑ »óȲ¿¡ ÀÖ´Â »ç¶÷µéÀ» À§ÇØ ´Ù¼Ò ½Ç¿ëÀûÀÎ °üÁ¡¿¡¼ Ã¥À» ÁýÇÊÇß´Ù. ±×¶§´Â ÀÌ¹Ì ÀÚ¿¬¾î ó¸® ºÐ¾ßÀÇ ¹®Á¦¿Í ¸Ó½Å·¯´×ÀÇ ±âº» ¿ø¸®¿¡ ´ëÇÑ Áö½ÄÀ» ÇÕ¸®ÀûÀ¸·Î ÆľÇÇÏ°í ÀÖ¾ú´Ù. ³ª´Â Ãß»óÀûÀÎ ¹æ¹ýÀ¸·Î¶óµµ º£ÀÌÁî Åë°èÇÐ, ƯÈ÷ ÀÚ¿¬¾î ó¸®¿Í °ü·ÃµÈ ºÎºÐ¿¡ ´ëÇØ ´õ ¹è¿ì°í ½Í¾ú´Ù. µû¶ó¼ ÀÌ Ã¥Àº Àü»ê ¾ð¾îÇÐÀÚµéÀÌ º£ÀÌÁî Á¢±Ù¹ýÀ» Àû¿ëÇÒ ¶§ ÇÊ¿äÇÑ ÁÖ¿ä ±â¼ú, ¿ë¾î ¹× ¸ðµ¨¿¡ ´ëÇÑ Ãß»óÀûÀÎ Á¤º¸¸¦ Á¦°øÇÏ´Â °üÁ¡¿¡¼ ½è´Ù. ±×·¯¹Ç·Î ÀÌ Ã¥ÀÇ ´ëºÎºÐÀÇ ÀåÀº ´Ù¼Ò ÀϹÝÀûÀÌ°í º£ÀÌÁî Åë°èÇаú ¹ÐÁ¢ÇÑ °ü·ÃÀÌ ÀÖ´Ù. ±×·¯³ª ¸¶Áö¸· Àå¿¡¼´Â ¾ð¾î ¸ðµ¨À» À§ÇØ ÁÖ·Î »ç¿ëµÇ´Â ¸î¸î ÀÚ¿¬¾î 󸮸¦ ÀÀ¿ë¹ýÀ» ¼Ò°³ÇÑ´Ù.
ÀÌ Ã¥Àº ÀÚ¿¬¾î ó¸®ÀÇ Åë°è ¸ðµ¨¸µ¿¡ ´ëÇØ ÀÌ¹Ì ¾î´À Á¤µµ ¾Ë°í ÀÖ´Â »ç¶÷µé°ú, ÀÚ¿¬¾î 󸮿¡¼ º£ÀÌÁî Åë°èÇÐÀÌ Æ¯È÷ ¾î¶»°Ô »ç¿ëµÇ´ÂÁö ´õ ÀÚ¼¼È÷ ¾Ë°í ½ÍÀº »ç¶÷µéÀ» À§ÇÑ Ã¥ÀÌ´Ù. º£ÀÌÁî ÀÚ¿¬¾î ó¸®ÀÇ ¼öÇÐÀûÀÎ Çؼ®¿¡ ´ëÇØ ´õ ÃÊÁ¡À» ¸ÂÃß°Ô µÈ µ¿±â´Â ¸Å¿ì °£´ÜÇÏ´Ù. ´ëºÎºÐÀÇ Àü»ê ¾ð¾îÇÐÀÚµéÀº ¾ð¾î ±¸Á¶¸¦ ¿¹ÃøÇϰųª, ¾ð¾îÇÐÀû µ¿±âºÎ¿©¸¦ ÀÏÀ¸Å°´Â ÀÚ¿¬¾î ó¸®ÀÇ ±âÃÊ ÇÙ½É ¿ë¾î¿¡ »ý°¢º¸´Ù ÀÏÂï ³ëÃâµÈ´Ù. Á¾Á¾ º£ÀÌÁî Åë°èÇаú ´Ù¸¥ Åë°èÇÐ µµ±¸µé¿¡ ´ëÇØ ±íÀÌ ÀÌÇØÇÏÁö ¸øÇÏ°í ³õÄ¡°Ô µÇ´Âµ¥, ÀÌ·Î ÀÎÇØ ¶§¶§·Î ¿ÀÇØ°¡ »ý±â°í Å« ±×¸²À» ³õÄ¡´Â °æ¿ì°¡ ¹ß»ýÇÑ´Ù. ÀÌ Ã¥Àº µ¶ÀÚµéÀÌ ³õÄ¥ ¼ö ÀÖ´Â ºÎºÐµéÀ» ÀÚ¼¼ÇÏ°Ô ¼³¸íÇØÁÙ °ÍÀÌ´Ù.
³»°¡ óÀ½ ÇÙ½É ¾ÆÀ̵ð¾î¸¦ Á¢ÇßÀ» ¶§, º£ÀÌÁî Åë°èÇÐÀÇ ¼öÇÐÀû ¶Ù¾î³²°ú ¿ì¾ÆÇÔ µî¿¡ ¸Å·áµÆÁö¸¸(¿øÄ¢ÀûÀ¸·Î º£ÀÌÁî Åë°èÇÐÀº µ¥ÀÌÅÍ¿Í ¸Å°³º¯¼ö »çÀÌ °ü°è¸¦ ¹ÝÀü½ÃÅ°±â À§ÇÑ º£ÀÌÁî ±ÔÄ¢À» Àû¿ëÇÏ´Â ÇϳªÀÇ Æ¯Á¤ ¿ø¸®¸¦ ±â¹ÝÀ¸·Î ÇÑ´Ù), ÀÌ Ã¥¿¡¼´Â ½Ç¿ëÀûÀÎ Á¢±Ù¹ýÀ» ÃëÇÏ¸ç º£ÀÌÁî Åë°èÇÐÀÌ ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ Åë°èÇÐÀû ºÐ¼®À» ±Ã±ØÀûÀÎ ÀÌ·ÐÀ¸·Î Á¦½ÃÇÏ·Á°í ÇÏÁö ¾Ê¾Ò´Ù. ±×¸®°í º£ÀÌÁî Åë°èÇÐÀ» ¼³¸íÇÒ ¼ö ÀÖ´Â ¶Ç ´Ù¸¥ öÇÐÀû ÁÖÀåÀ» Á¦½ÃÇÏÁö ¾Ê¾Ò´Ù. ´ë½Å¿¡ º£ÀÌÁî Åë°èÇÐÀÇ µÞ¹ÞħÀÌ µÇ´Â ±â¼úÀû ¸ÞÄ¿´ÏÁòÀ» ¼³¸íÇÏ°í, µ¶ÀÚµéÀÌ ÀÚ¿¬¾î ó¸® ¹®Á¦¿¡¼ ´õ ÁÁÀº ¹æ¹ý·ÐÀ» ¼±ÅÃÇÒ ¼ö ÀÖµµ·Ï µµ¿ÍÁÙ °ÍÀÌ´Ù. ¶ÇÇÑ º£ÀÌÁî Åë°èÇаú ºóµµÁÖÀÇÀû Á¢±Ù¹ý°úÀÇ °ü°è, ¾Æ¿ï·¯ ±× ¹ÛÀÇ ´Ù¸¥ ºÎºÐ°ú °áÇյǴ ºÎºÐµµ ¼³¸íÇÑ´Ù.
[¿Å±äÀÌÀÇ ¸»]
ÀΰøÁö´É ±â¼úÀÌ ¹ßÀüÇÏ¸é¼ ºñ¾àÀûÀÎ ¼ºÀåÀ» ÀÌ·ç°í ÀÖ´Â ÀÚ¿¬¾î ó¸® ºÐ¾ß¿¡ °ü·ÃµÈ Ã¥ÀÌ´Ù. ÀÚ¿¬¾î 󸮿¡ ´ëÇÑ ÀϹÝÀûÀÎ ³»¿ëÀ» ÀÌÇØÇÏ°í ÀÖ´Ù¸é º£ÀÌÁö¾ÈÀ» È°¿ëÇÑ Á¢±ÙÀ» ÅëÇØ ÀÚ¿¬¾î 󸮸¦ »õ·Î¿î ½Ã°¢¿¡¼ ¹Ù¶óº¼ ¼ö ÀÖÀ» °ÍÀÌ´Ù. Åë°è °³³äÀÌ ¸¹ÀÌ µîÀåÇÏ°í ´Ù¼Ò ¾î·Æ°Ô ´À²¸Áú ¼ö´Â ÀÖÀ¸³ª, Åë°èÀûÀÎ ÃßÁ¤¿¡ ±Ù°ÅÇÑ ÀÚ¿¬¾î 󸮴 ¾î¶² ¸ð½ÀÀÌ°í ¾î¶»°Ô ¿¬±¸µÇ°í ÀÖ´ÂÁö Á¢ÇÒ ¼ö ÀÖ´Ù. ÁÖÁ¦¿Í ³»¿ëÀº ¾î·Á¿ï ¼ö ÀÖÁö¸¸ ÀúÀÚ°¡ ÃÖ´ëÇÑ ½±°Ô ¼³¸íÇÏ·Á°í ÇßÀ¸¸ç, ³ª ¶ÇÇÑ ÀúÀÚÀÇ Àǵµ¿¡ µû¶ó ÀÌÇØÇϱ⠽±°Ô ¹ø¿ªÇÏ·Á°í ³ë·ÂÇß´Ù.