- ÇöÀç À§Ä¡
- home > ÄÄÇ»ÅÍ¡¤ICT¡¤¾îÇÐ > ÄÄÇ»ÅÍ¡¤IT µµ¼ > Àü»êÅë°è/Çؼ® > Data Lake Ç÷§Æû ¾ÆÅ°ÅØó[ÁÁÀº¶¥]
±â¾÷ÀÇ ºñÁî´Ï½º ¹æÇâÀ» °í·ÁÇÑ ºòµ¥ÀÌÅÍ ¼ºñ½º Ç÷§ÆûÀ» ¼³°èÇÏÀÚ!
±Û·Î¹ú ´ëÇü ±â¾÷µéÀº ¡®µðÁöÅÐ Àüȯ(Digital Transformation)¡¯À» ÇÙ½É Çö¾ÈÀ¸·Î ÃßÁøÇÏ°í ÀÖ½À´Ï´Ù. ÀÌ °úÁ¤¿¡¼ Data Lake ±¸ÃàÀº °¡Àå Áß¿äÇÑ °úÁ¦ Áß ÇϳªÀÏ °ÍÀÔ´Ï´Ù. ´Ù¸¥ ±â¾÷µéó·³ ¡®¶÷´Ù ¾ÆÅ°ÅØ󡮸¦ ±â¹ÝÀ¸·Î ÇÏ¿© ÇÏµÓ ¿¡ÄڽýºÅÛÀ» È°¿ëÇؼ ±¸ÃàÇÏ¸é µÇ´Â °ÍÀϱî¿ä? ¾Æ´Ï¸é AWS ȤÀº AzureÀÇ Public Cloud ¼ºñ½º¸¦ È°¿ëÇÏ¿© ±¸ÃàÇÏ¸é µÇ´Â °ÍÀϱî¿ä? ¿ì¸® ±â¾÷ÀÇ ºñÁî´Ï½º¿¡ ÀûÇÕÇÑ Data Lake ¾ÆÅ°ÅØó´Â ¹«¾ùÀϱî¿ä? ÀÌ·¯ÇÑ ¡®Áß¿äÇÑ Áú¹®µé¡¯¿¡ ´ëÇÑ ÇØ´äÀ» ¾ò°íÀÚ ÇÑ´Ù¸é ÀÌ Ã¥À» ¹Ýµå½Ã Àоî¾ß ÇÒ °ÍÀÔ´Ï´Ù.
¡¤ ºòµ¥ÀÌÅÍ ÂüÁ¶ ¾ÆÅ°ÅØó(¶÷´Ù vs. Ä«ÆÄ)
¡¤ ºòµ¥ÀÌÅÍ ¼Ö·ç¼Ç ¾ÆÅ°ÅØó(Cloudera vs. AWS vs. Azure)
¡¤ Data Lake ¾ÆÅ°ÅØó ¼³°è ±âº»¿øÄ¢
¡¤ ´Ü±â¿Í Àå±â °³³ä ¾ÆÅ°ÅØóÀÇ ¼³°è
¡¤ ¾ÆÅ°ÅØó ¼³°è ½Ã ÁÖ¿ä ÀÇ»ç°áÁ¤ »çÇ×
¡¤ ±¸¼º¿ä¼Òº° »ó¼¼ ¾ÆÅ°ÅØó ¼³°è
?
±Û·Î¹ú ´ëÇü ±â¾÷µéÀº ¡®µðÁöÅÐ Àüȯ(Digital Transformation)¡¯À» ÇÙ½É Çö¾ÈÀ¸·Î ÃßÁøÇÏ°í ÀÖ½À´Ï´Ù. ÀÌ °úÁ¤¿¡¼ Data Lake ±¸ÃàÀº °¡Àå Áß¿äÇÑ °úÁ¦ Áß ÇϳªÀÏ °ÍÀÔ´Ï´Ù. ´Ù¸¥ ±â¾÷µéó·³ ¡®¶÷´Ù ¾ÆÅ°ÅØ󡮸¦ ±â¹ÝÀ¸·Î ÇÏ¿© ÇÏµÓ ¿¡ÄڽýºÅÛÀ» È°¿ëÇؼ ±¸ÃàÇÏ¸é µÇ´Â °ÍÀϱî¿ä? ¾Æ´Ï¸é AWS ȤÀº AzureÀÇ Public Cloud ¼ºñ½º¸¦ È°¿ëÇÏ¿© ±¸ÃàÇÏ¸é µÇ´Â °ÍÀϱî¿ä? ¿ì¸® ±â¾÷ÀÇ ºñÁî´Ï½º¿¡ ÀûÇÕÇÑ Data Lake ¾ÆÅ°ÅØó´Â ¹«¾ùÀϱî¿ä? ÀÌ·¯ÇÑ ¡®Áß¿äÇÑ Áú¹®µé¡¯¿¡ ´ëÇÑ ÇØ´äÀ» ¾ò°íÀÚ ÇÑ´Ù¸é ÀÌ Ã¥À» ¹Ýµå½Ã Àоî¾ß ÇÒ °ÍÀÔ´Ï´Ù.
¡¤ ºòµ¥ÀÌÅÍ ÂüÁ¶ ¾ÆÅ°ÅØó(¶÷´Ù vs. Ä«ÆÄ)
¡¤ ºòµ¥ÀÌÅÍ ¼Ö·ç¼Ç ¾ÆÅ°ÅØó(Cloudera vs. AWS vs. Azure)
¡¤ Data Lake ¾ÆÅ°ÅØó ¼³°è ±âº»¿øÄ¢
¡¤ ´Ü±â¿Í Àå±â °³³ä ¾ÆÅ°ÅØóÀÇ ¼³°è
¡¤ ¾ÆÅ°ÅØó ¼³°è ½Ã ÁÖ¿ä ÀÇ»ç°áÁ¤ »çÇ×
¡¤ ±¸¼º¿ä¼Òº° »ó¼¼ ¾ÆÅ°ÅØó ¼³°è
?
ÀúÀÚ: À±¼±¿õ (ÁöÀºÀÌ)
¸Ó¸®¸»
Á¦1Àå Data Lake °³¿ä
1. Data LakeÀÇ µîÀå ¹è°æ
2. Data LakeÀÇ Á߿伺
3. Data LakeÀÇ °³³ä
4. Data Lake ±¸¼º¿ä¼Ò
Á¦2Àå Data Lake ÂüÁ¶ ¾ÆÅ°ÅØó
1. ºòµ¥ÀÌÅÍ ÂüÁ¶ ¾ÆÅ°ÅØó
1-1. ¶÷´Ù ¾ÆÅ°ÅØó
1-2. Ä«ÆÄ ¾ÆÅ°ÅØó
1-3. ÂüÁ¶ ¾ÆÅ°ÅØó °£ ºñ±³
2. ºòµ¥ÀÌÅÍ ¼Ö·ç¼Ç ¾ÆÅ°ÅØó
2-1. Cloudera Hadoop
2-2. Cloudera Data Platform
2-3. AWS Data Lake
2-4. Azure Data Lake
2-5. ¼Ö·ç¼Ç ¾ÆÅ°ÅØó °£ ºñ±³
Á¦3Àå Data Lake ¾ÆÅ°ÅØó ¼³°è
1. ¾ÆÅ°ÅØó ¼³°è ±âº» ¿øÄ¢
2. ¾ÆÅ°ÅØó ¼³°è ¹æÇâ
2-1. ´Ü±â ¾ÆÅ°ÅØó
2-2. Àå±â ¾ÆÅ°ÅØó
2-3. ¼³°è ½Ã ÁÖ¿ä ÀÇ»ç°áÁ¤ »çÇ×
3. ±¸¼º¿ä¼Òº° ¾ÆÅ°ÅØó ¼³°è
3-1. µ¥ÀÌÅÍ ¼öÁý Layer
3-2. µ¥ÀÌÅÍ ÀûÀç Layer
3-3. µ¥ÀÌÅÍ Ã³¸® Layer
3-4. µ¥ÀÌÅÍ Á¦°ø Layer
3-5. »ç¿ëÀÚ Self-Service Layer
3-6. µ¥ÀÌÅÍ °Å¹ö³Í½º Layer
¸ÎÀ½¸»
Âü°íÀÚ·á
»öÀÎ
Á¦1Àå Data Lake °³¿ä
1. Data LakeÀÇ µîÀå ¹è°æ
2. Data LakeÀÇ Á߿伺
3. Data LakeÀÇ °³³ä
4. Data Lake ±¸¼º¿ä¼Ò
Á¦2Àå Data Lake ÂüÁ¶ ¾ÆÅ°ÅØó
1. ºòµ¥ÀÌÅÍ ÂüÁ¶ ¾ÆÅ°ÅØó
1-1. ¶÷´Ù ¾ÆÅ°ÅØó
1-2. Ä«ÆÄ ¾ÆÅ°ÅØó
1-3. ÂüÁ¶ ¾ÆÅ°ÅØó °£ ºñ±³
2. ºòµ¥ÀÌÅÍ ¼Ö·ç¼Ç ¾ÆÅ°ÅØó
2-1. Cloudera Hadoop
2-2. Cloudera Data Platform
2-3. AWS Data Lake
2-4. Azure Data Lake
2-5. ¼Ö·ç¼Ç ¾ÆÅ°ÅØó °£ ºñ±³
Á¦3Àå Data Lake ¾ÆÅ°ÅØó ¼³°è
1. ¾ÆÅ°ÅØó ¼³°è ±âº» ¿øÄ¢
2. ¾ÆÅ°ÅØó ¼³°è ¹æÇâ
2-1. ´Ü±â ¾ÆÅ°ÅØó
2-2. Àå±â ¾ÆÅ°ÅØó
2-3. ¼³°è ½Ã ÁÖ¿ä ÀÇ»ç°áÁ¤ »çÇ×
3. ±¸¼º¿ä¼Òº° ¾ÆÅ°ÅØó ¼³°è
3-1. µ¥ÀÌÅÍ ¼öÁý Layer
3-2. µ¥ÀÌÅÍ ÀûÀç Layer
3-3. µ¥ÀÌÅÍ Ã³¸® Layer
3-4. µ¥ÀÌÅÍ Á¦°ø Layer
3-5. »ç¿ëÀÚ Self-Service Layer
3-6. µ¥ÀÌÅÍ °Å¹ö³Í½º Layer
¸ÎÀ½¸»
Âü°íÀÚ·á
»öÀÎ
ÀÌ Ã¥Àº ÀúÀÚÀÇ Data Lake ½Ã¸®ÁîÀÇ ¼¼ ¹ø° Ã¥À¸·Î, Data Lake Ç÷§ÆûÀÇ Ã»»çÁø(Blueprint)À» ¼³°èÇϱâ À§ÇÑ ½Ç¹«ÀÚµéÀ» À§ÇÑ Ã¥ÀÌ´Ù.
ù ¹ø° Ã¥ÀÎ ¡¶Â÷¼¼´ë ºòµ¥ÀÌÅÍ Ç÷§Æû Data Lake¡·´Â Data Lake Ç÷§ÆûÀÇ Àü¹ÝÀûÀÎ °³¿ä¸¦ ´Ù·ç¾ú°í, Data Lake°¡ ¹«¾ùÀÌ°í, ¹«¾ùÀ» ¸ñÀûÀ¸·Î ÇÏ´ÂÁö¸¦ ¾Ë·Á ÁØ´Ù. µÎ ¹ø° Ã¥ÀÎ ¡¶Data Catalog ¸¸µé±â¡·´Â Data Lake Ç÷§ÆûÀÇ ÇÙ½É ¼ºñ½º¶ó°í ÇÒ ¼ö ÀÖ´Â Data Catalog ¼ºñ½º¸¦ ¼Ò°³ÇÏ°í, À̸¦ ¾î¶»°Ô ¼³°èÇÏ°í ±¸ÃàÇØ¾ß ÇÏ´ÂÁö¿¡ ´ëÇÑ ¹æ¹ý·Ð°ú ¿¹½Ã¸¦ Áß½ÉÀ¸·Î ±â¼úÇÏ¿´´Ù. ¼¼ ¹ø° Ã¥ÀÎ ÀÌ Ã¥¿¡¼´Â Data LakeÀÇ Àüü Ç÷§ÆûÀ» ¾î¶»°Ô ¼³°èÇÒÁö¿¡ ´ëÇÑ ³»¿ëÀ» ±â¼úÇÏ¿´´Ù.
Data Catalog´Â ¡®»ç¿ëÀÚ Self-Service Layer¡¯ÀÇ ÇϳªÀÇ ±¸¼º¿ä¼Ò¿¡ ºÒ°úÇÏÁö¸¸, Data Lake Ç÷§ÆûÀº ¸¹Àº ±¸¼º¿ä¼Ò¿Í ±â¼ú¿ä¼Ò¸¦ Æ÷ÇÔÇÏ°í ÀÖ´Â º¹ÀâÇÑ ½Ã½ºÅÛÀÌ´Ù. Data Lake ¾ÆÅ°ÅØÆ®´Â ÀÌ·¯ÇÑ ¸¹Àº ±¸¼º¿ä¼Ò¸¦ Á¤ÀÇÇÏ°í ±â¼úÀ» °ËÅäÇÏ°í ¾ÆÅ°ÅØó¸¦ ¼³°èÇØ¾ß ÇÑ´Ù.
ÇÏÁö¸¸ ÀÌµé ¾ÆÅ°ÅØÆ®°¡ Âü°íÇÒ ¼ö ÀÖ´Â ÀÚ·á´Â »ç½Ç»ó ÇØ¿Ü ÀÚ·á ¸î ±Ç°ú À̸¦ ¹ø¿ªÇÑ ÀÚ·á Á¤µµÀ̸ç, ÀÌ ÀÚ·áµéÀº ¡®¶÷´Ù ¾ÆÅ°ÅØ󡯸¦ ±â¹ÝÀ¸·Î ÇÑ ¾ÆÁÖ ´ë·«ÀûÀÎ ±¸Çö ¸ð½À¸¸À» Á¦°øÇÏ°í ÀÖ´Ù. Data Lake ¼³°è¸¦ À§ÇÑ Âü°í ÀÚ·á°¡ ºÎÁ·ÇÑ »óȲ¿¡¼, ÀúÀÚÀÇ Áö³ 3³â°£ÀÇ Data Lake ÇÁ·ÎÁ§Æ® ¼öÇà°ú ¸®¼Ä¡ °æÇèÀ» ¹ÙÅÁÀ¸·Î Á» ´õ Á¾ÇÕÀûÀÎ °üÁ¡¿¡¼ ¼³°è¸¦ À§ÇÑ ±âÃÊ ÀڷḦ Á¦°øÇÑ´Ù.
ù ¹ø° Ã¥ÀÎ ¡¶Â÷¼¼´ë ºòµ¥ÀÌÅÍ Ç÷§Æû Data Lake¡·´Â Data Lake Ç÷§ÆûÀÇ Àü¹ÝÀûÀÎ °³¿ä¸¦ ´Ù·ç¾ú°í, Data Lake°¡ ¹«¾ùÀÌ°í, ¹«¾ùÀ» ¸ñÀûÀ¸·Î ÇÏ´ÂÁö¸¦ ¾Ë·Á ÁØ´Ù. µÎ ¹ø° Ã¥ÀÎ ¡¶Data Catalog ¸¸µé±â¡·´Â Data Lake Ç÷§ÆûÀÇ ÇÙ½É ¼ºñ½º¶ó°í ÇÒ ¼ö ÀÖ´Â Data Catalog ¼ºñ½º¸¦ ¼Ò°³ÇÏ°í, À̸¦ ¾î¶»°Ô ¼³°èÇÏ°í ±¸ÃàÇØ¾ß ÇÏ´ÂÁö¿¡ ´ëÇÑ ¹æ¹ý·Ð°ú ¿¹½Ã¸¦ Áß½ÉÀ¸·Î ±â¼úÇÏ¿´´Ù. ¼¼ ¹ø° Ã¥ÀÎ ÀÌ Ã¥¿¡¼´Â Data LakeÀÇ Àüü Ç÷§ÆûÀ» ¾î¶»°Ô ¼³°èÇÒÁö¿¡ ´ëÇÑ ³»¿ëÀ» ±â¼úÇÏ¿´´Ù.
Data Catalog´Â ¡®»ç¿ëÀÚ Self-Service Layer¡¯ÀÇ ÇϳªÀÇ ±¸¼º¿ä¼Ò¿¡ ºÒ°úÇÏÁö¸¸, Data Lake Ç÷§ÆûÀº ¸¹Àº ±¸¼º¿ä¼Ò¿Í ±â¼ú¿ä¼Ò¸¦ Æ÷ÇÔÇÏ°í ÀÖ´Â º¹ÀâÇÑ ½Ã½ºÅÛÀÌ´Ù. Data Lake ¾ÆÅ°ÅØÆ®´Â ÀÌ·¯ÇÑ ¸¹Àº ±¸¼º¿ä¼Ò¸¦ Á¤ÀÇÇÏ°í ±â¼úÀ» °ËÅäÇÏ°í ¾ÆÅ°ÅØó¸¦ ¼³°èÇØ¾ß ÇÑ´Ù.
ÇÏÁö¸¸ ÀÌµé ¾ÆÅ°ÅØÆ®°¡ Âü°íÇÒ ¼ö ÀÖ´Â ÀÚ·á´Â »ç½Ç»ó ÇØ¿Ü ÀÚ·á ¸î ±Ç°ú À̸¦ ¹ø¿ªÇÑ ÀÚ·á Á¤µµÀ̸ç, ÀÌ ÀÚ·áµéÀº ¡®¶÷´Ù ¾ÆÅ°ÅØ󡯸¦ ±â¹ÝÀ¸·Î ÇÑ ¾ÆÁÖ ´ë·«ÀûÀÎ ±¸Çö ¸ð½À¸¸À» Á¦°øÇÏ°í ÀÖ´Ù. Data Lake ¼³°è¸¦ À§ÇÑ Âü°í ÀÚ·á°¡ ºÎÁ·ÇÑ »óȲ¿¡¼, ÀúÀÚÀÇ Áö³ 3³â°£ÀÇ Data Lake ÇÁ·ÎÁ§Æ® ¼öÇà°ú ¸®¼Ä¡ °æÇèÀ» ¹ÙÅÁÀ¸·Î Á» ´õ Á¾ÇÕÀûÀÎ °üÁ¡¿¡¼ ¼³°è¸¦ À§ÇÑ ±âÃÊ ÀڷḦ Á¦°øÇÑ´Ù.