Python/XML HOWTO The Python/XML Special Interest Group
xml-sig@python.org
¼Û Àç°æ
ssaky@kldp.org
XML Àº SGML ÀÇ ¼­ºê¼ÂÀÎ, È®Àå°¡´ÉÇÑ Á¶ÆǾð¾î(eXtensible Markup Language) ·Î¼­, ƯÁ¤ÇÑ ¾îÇø®ÄÉÀÌ¼Ç Á¶ÆǾð¾î¸¦ »ý¼ºÇÏ°í ó¸®Çϴ°ÍÀ» °¡´ÉÇÏ°Ô ÇØÁØ´Ù. Python Àº XML µ¥ÀÌÅ͸¦ ó¸®Çϴµ¥ ¸Å¿ì ÈǸ¢ÇÑ ¾ð¾îÀÌ´Ù. ÀÌ ¹®¼­´Â Python/XML ÆÐÅ°ÁöÀÇ Æ©Å͸®¾ó·Î¼­, À̱ÛÀ» Àд µ¶ÀÚ°¡ ÀÌ¹Ì XML ÀÇ ±¸Á¶¿Í Àü¹®¿ë¾î¿¡ Àͼ÷ÇÏ´Ù°í °¡Á¤ÇÏ¿© ¾²¿©Á³´Ù. À̹®¼­´Â ÃʾÈÀ¸·Î¼­ 'XXX' ¶ó°í Ç¥ÇöµÇ´Â ºÎºÐÀº ÈÄ¿¡ ä¿öÁö°Å³ª, ´Ù½Ã ¾²À̰ųª, ¼öÁ¤µÉ ºÎºÐÀÌ´Ù.
XML ÀÇ ½ÃÀÛ XML Àº eXtensible Markup Language ·Î¼­ SGML(Standardized General Markup Language)ÀÇ ºÎºÐÁýÇÕÀÌ´Ù. XML Àº ½±°Ô ½ÇÇàÇÏ°í »ç¿ëÇϴ°ÍÀ» ÁöÇâÇϸç, ÀÌ¹Ì »õ·Î¿î ´Ù¾çÇÑ Ç¥ÁØÀ» À§ÇÑ Æ¯¼öÇÑ ¸¶Å©¾÷ ¾ð¾î·Î »ç¿ëµÇ°í ÀÖ´Ù. ¿©±â¿¡´Â ¼öÇÐÀûÀÎ µî½ÄÀ» Ç¥ÇöÇϱâ À§ÇÑ MathML, ¸ÖƼ¹Ìµð¾î¸¦ Ç¥ÇöÇϱâ À§ÇÑ Synchronized Multimedia Integration Language µîÀÌ ÀÖ´Ù. SGML °ú XML Àº ¹®¼­ÀÇ ´Ù¾çÇÑ ±¸¼º¿ä¼ÒµéÀ» ±×µéÀÇ ±â´É°ú Àǹ̰ú ÇÔ²² ű×È­ÇÏ¿© Ç¥ÇöÇÑ´Ù. ¿¹¸¦ µé¾î ·¹Æ÷Æ®´Â ¿©·¯°¡Áö ºÎºÐÀ¸·Î ³ª´·¼öÀÖ´Ù. : ±×°ÍÀº Á¦¸ñ(title) °ú ÇѸíÀÌ»óÀÇ ÀÛ¼ºÀÚ(author), ¼­¹®(abstract), ½ÇÁ¦ ·¹Æ÷Æ®ÀÇ ³»¿ë, Âü°íÀÚ·á ¸ñ·Ï µîÀ¸·Î ³ª´­¼ö ÀÖÀ»°ÍÀÌ´Ù. ÀÌ·¯ÇÑ ·¹Æ÷Æ®¸¦ ÀÛ¼ºÇϱâ À§ÇÑ ¸¶Å©¾÷ ¾ð¾î´Â, ±× ³»¿ëÀÌ ¼­¹®ÀÎÁö, Á¦¸ñÀÎÁöµîÀ» °¡¸®Å³¼öÀִ ű׸¦ °¡Áö°í ÀÖ¾î¾ß ÇÑ´Ù. ÀÌ·¸°Ô ÇÔÀ¸·Î¼­, ¾î¶»°Ô ¹®¼­°¡ ½ÇÁ¦ÀûÀ¸·Î Ãâ·ÂµÉÁö¿¡ ´ëÇÑ ¹°¸®ÀûÀÎ ¼¼ºÎ±â¼ú¿¡ È¥µ¿À» ÁÖÁö ¾ÊÀ»°ÍÀÌ´Ù. ¼­¹®Àº ¹®¼­ÀÇ ´Ù¸¥ ºÎºÐº¸´Ù ÀÛÀº ÆùÆ®¿Í Á¼Àº ÆøÀÇ ¿©¹éÀ¸·Î Ãâ·ÂµÇ¾î¾ß ÇÒ°ÍÀÌ´Ù. ±×·¯³ª ¸¶Å©¾÷Àº º¸Åë ÀÌ·¸°Ô ÀÚ¼¼ÇÑ ¼¼ºÎ±â¼úÀ» ÇÏÁö´Â ¾Ê´Â´Ù.; ´Ù¸¥ ÇÁ·Î±×·¥À» »ç¿ëÇÏ¿© ¸¶Å©¾÷ ¾ð¾î¸¦ TEX ¿Í °°Àº ½ÄÀÚ¾ð¾î·Î º¯È¯ÇÒ ¼ö ÀÖÀ»°ÍÀÌ°í, Á¤±³ÇÏ°Ô Ã³¸®ÇÒ ¼ö ÀÖÀ»°ÍÀÌ´Ù. XML Àº HTML °ú ¸Å¿ì Èí»çÇÑ ¸ð¾çÀ» °®´Â´Ù; ¹®¼­´Â ÇÏÀ§¿ä¼Ò¸¦ Æ÷ÇÔÇÏ´Â ÇϳªÀÇ ¿ä¼Ò(element)·Î ±¸¼ºµÈ´Ù. ±×¸®°í ±× ÇÏÀ§¿ä¼ÒµéÀº ±×µé ÀÚ½ÅÀÇ ³»¿ëÀ¸·Î ¶Ç ÇÏÀ§¿ä¼ÒµéÀ» °¡Áú ¼ö ÀÖ´Ù. ¿ä¼Ò´Â ¹®Àå¾È¿¡¼­ < > ¾È¿¡ Á¸ÀçÇϴ ű׷ΠǥÇöµÈ´Ù. ¿ä¼Ò¿¡´Â µÎ°¡Áö Ç¥Çö ¹æ¹ýÀÌ ÀÖ´Ù. ±×Áß Çϳª´Â <name>Euryale</name> ¿Í °°ÀÌ ½ÃÀÛÅÂ±×¿Í ¸¶Ä§Å±װ¡ Á¸ÀçÇϴ°ÍÀÌ´Ù. ÀÌ°ÍÀº "Euryale" ³»¿ë(content)À» °®´Â name ¿ä¼Ò¸¦ ³ªÅ¸³½´Ù. ÀÌ·¯ÇÑ ³»¿ë¿¡´Â ÀϹÝÀûÀÎ ÅؽºÆ® µ¥ÀÌÅÍ, XML ¿ä¼Ò, ¶Ç´Â ÀÌ µÎ°¡Áö°¡ È¥ÇÕµÇ¾î ³ªÅ¸³¯ ¼ö ÀÖ´Ù. ¿ä¼Ò´Â ¶ÇÇÑ ¾Æ¹«·± ³»¿ëµµ °¡ÁöÁö ¾Ê´Â °ø¹éÀϼöµµ ÀÖ´Ù. ÀÌ·¯ÇÑ ¶§¿¡´Â <stop/> °ú °°ÀÌ ½½·¡½¬·Î ³¡³ª´Â ÇϳªÀÇ Å±׷ΠǥÇöµÈ´Ù. HTML °ú´Â ´Þ¸® XML Àº ´ë¼Ò¹®ÀÚ¸¦ ±¸ºÐÇÑ´Ù. ±×·¯¹Ç·Î stop °ú Stop Àº ¼­·Î ´Ù¸¥ µÎ°³ÀÇ ¿ä¼Ò·Î ÀνĵȴÙ. ½ÃÀÛÅÂ±×¿Í °ø¹éű״Â, ±× ¿ä¼Ò¿Í ÇÔ²²Çϴ ƯÁ¤°ªÀ» °®´Â ¼Ó¼º(attribute)À» °¡Áú ¼ö ÀÖ´Ù. ¿¹¸¦ µé¾î <name lang='greek'>Herakles</name> Àº ±× °ªÀÌ "greek" ÀÎ lang ¼Ó¼ºÀ» °®´Â name ¿ä¼Ò¸¦ ³ªÅ¸³½´Ù. ÀÌ°ÍÀº ¼Ó¼º°ªÀÌ 'latin' ÀÎ <name lang='latin'>Hercules</name> °ú ºñ±³µÉ ¼ö ÀÖÀ»°ÍÀÌ´Ù. XML ¾ð¾î´Â DTD (Document Type Definition) ·Î Á¤ÀǵȴÙ. DTD ´Â ¿ä¼Ò°¡ °¡Áú ¼ö ÀÖ´Â À̸§°ú, ¾î¶² ¿ä¼Ò°¡ ¼­·Î ÁßøµÉ¼ö Àִ°¡µîÀ» Á¤ÀÇÇØÁØ´Ù. DTD ´Â ¶ÇÇÑ °¢ ¿ä¼Ò¿¡ ³ªÅ¸³¯¼öÀÖ´Â ¼Ó¼º°ú ±× ±âº»°ª, ±×¸®°í ±× °ªÀÌ »ý·«ÇÒ ¼ö ÀÖ´Â °ªÀÎÁö µî¿¡ ´ëÇØ Á¤ÀÇÇÑ´Ù. HTML À» ¿¹·Î µé¸é, LI ¿ä¼Ò´Â ¸®½ºÆ®ÀÇ ¸ñ·ÏÀ» Ç¥ÇöÇÒ ¶§ »ç¿ëµÇ¾îÁö´Âµ¥, ¸®½ºÆ®¸¦ Ç¥ÇöÇÏ´Â OL ¶Ç´Â UL ¿ä¼Ò¾È¿¡¼­¸¸ »ç¿ëÇؾßÇÑ´Ù. ÀûÇÕÇÑ Æļ­´Â DTD ¿Í ¹®¼­¸¦ ³Ñ°Ü¹Þ¾Æ, ±× ¹®¼­°¡ DTD ÀÇ ¹ýÄ¢¿¡ Àß ¸Â´ÂÁö¸¦ °ËÁõÇØÁְųª, Çϳª ¶Ç´Â ±× ÀÌ»óÀÇ ¹ýÄ¢¿¡ À§¹èµÇ¾ú´Ù´Â °ÍÀ» °áÁ¤ÇØÁÖ°Ô µÈ´Ù. XML À» ó¸®Çϱâ À§ÇÑ ¾îÇø®ÄÉÀ̼ÇÀº µÎ°¡Áö ŸÀÔÀ¸·Î ±¸ºÐµÇ¾îÁú ¼ö ÀÖ´Ù. °¡Àå °£´ÜÇÑ ºÎ·ù´Â ƯÁ¤ÇÑ ÇϳªÀÇ ¸¶Å©¾÷ ¾ð¾î¸¦ Á¶ÀÛÇϱâ À§ÇÑ ¾îÇø®ÄÉÀ̼ÇÀÌ´Ù. ¿¹¸¦ µé¾î, È­Çаü·Ã ÇÁ·Î±×·¥Àº MathML ÀÌ ¾Æ´Ñ, È­ÇÐ ¸¶Å©¾÷ ¾ð¾î¸¸À» ó¸®Çϱ⸦ ¿øÇÒ°ÍÀÌ´Ù. ÀÌ·¯ÇÑ ¾îÇø®ÄÉÀ̼ÇÀº ÇϳªÀÇ DTD ·Î ¸í¼¼È­ ÇÒ¼ö ÀÖÀ¸¸ç, ¿©·¯Á¾·ùÀÇ ¸¶Å©¾÷ ¾ð¾î¸¦ Çڵ鸵Çϱâ À§ÇÑ ´É·ÂÀº ÇÊ¿ä¾øÀ» °ÍÀÌ´Ù. ÀÌ·¯ÇÑ ºÎ·ù´Â ÀÛ¼ºÇϱⰡ ½¬¿ì¸ç, ÀÌ¿ë°¡´ÉÇÑ ÆÄÀ̽㠼ÒÇÁÆ®¿þ¾î·Î ±¸ÇöÇϱⰡ ½¬¿îÆíÀÌ´Ù. µÎ¹ø° ºÎ·ù´Â Á» ´õ ¹ü¿ëÀûÀ̸ç, ¾î¶°ÇÑ ¸¶Å©¾÷ ¾ð¾î¿¡ ´ëÇؼ­µµ Çڵ鸵ÀÌ °¡´ÉÇÑ °ÍÀÌ´Ù. ¼±ÅÃµÈ DTD ¸¦ µû¸£´Â XML À» ÀÛ¼ºÇϵµ·Ï µµ¿ÍÁÖ´Â '½º¸¶Æ® XML ¿¡µðÅÍ' °°Àº ÇÁ·Î±×·¥À» ¿¹·Î µé¾îº¸ÀÚ. ÀÌ°ÍÀº Çã¿ëµÇÁö ¾Ê´Â ¿ä¼Ò¸¦ ÀÔ·ÂÇϴ°ÍÀ» ¸·¾ÆÁÖ¾î¾ß ÇÒ°ÍÀÌ°í, Ä¿¼­À§Ä¡¿¡ ³õÀϼö ÀÖ´Â ÀûÀýÇÑ ¿ä¼ÒµéÀ» Á¦¾ÈÇÒ ¼ö ÀÖÀ»°ÍÀÌ´Ù. ÀÌ·¯ÇÑ ¾îÇø®ÄÉÀ̼ÇÀº ¾î¶°ÇÑ °¡´ÉÇÑ XML ±â¹ÝÀÇ ¸¶Å©¾÷µµ Çڵ鸵 °¡´ÉÇØ¾ß Çϸç, ±×·¯±â À§Çؼ­´Â, »ç¿ëµÇ´Â DTD ¸¦ Æ÷ÇÔÇÏ´Â µ¥ÀÌÅÍ ±¸Á¶¸¦ °¡Áö°í ÀÖ¾î¾ß ÇÒ°ÍÀÌ´Ù. XXX ÀÌ·¯ÇÑ ÇüÅÂÀÇ ¾îÇø®ÄÉÀ̼ÇÀº ÇöÀç·Î¼± ÆÄÀ̽ãÀ¸·Î ±¸ÇöÇϱâ´Â ¾î·Á¿î »óȲÀÌ´Ù. (XXX DTD ¸ðµâÀÌ Ãß°¡µÇ±â¸¦ ÁöÄѺÁ¾ß ÇÒ°ÍÀÌ´Ù...) XML ÀÇ ¹®¹ý¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ ÀÚ·á´Â, http://www.w3.org/TR/xml-spec.html ¿¡¼­ XML 1.0 ¸í¼¼¼­¸¦ º¼ ¼ö ÀÖÀ»°ÍÀÌ´Ù. ¸ðµç ¸í¼¼¼­¿Í ¸¶Âù°¡Áö·Î, ÀÌ°ÍÀº ¸Å¿ì Çü½ÄÀûÀ̸ç, XML À» ½ÃÀÛÇϰųª ¹è¿ì±â À§ÇØ º¸±â¿¡´Â ÀûÇÕÇÏÁö°¡ ¾Ê´Ù. Ç¥ÁØ¿¡ ÁÖ¼®ÀÌ ºÙÀº ¹öÀüÀÎ http://www.xml.com/xml/pub/axml/axmlintro.html ÀÌ ´õ ÀÌÇØÇϱ⠽¬¿ï°ÍÀÌ´Ù. ¶ÇÇÑ ¿©±â¿¡´Â XML À» ½ÃÀÛÇÏ·Á´Â »ç¶÷¿¡°Ô ÀûÇÕÇÑ Æ©Å丮¾óµîÀÇ ´Ù¾çÇÑ ¹®¼­µéµµ ÀÖ´Ù. ÀÌ HOWTO ÀÇ ³ª¸ÓÁö ºÎºÐ¿¡¼­´Â, ÀÌ¹Ì ÀûÀýÇÑ Àü¹®¿ë¾î¿¡ Àͼ÷ÇÏ´Ù°í »ý°¢ÇÒ°ÍÀ̸ç, ´ëºÎºÐÀÇ ¼½¼Ç¿¡¼­ ¿ä¼Ò(element) ¿Í ¼Ó¼º(attribute) µîÀÇ XML ¿ë¾îµéÀ» »ç¿ëÇÒ °ÍÀÌ´Ù. ¹®¼­ °´Ã¼ ¸ðµ¨À» ´Ù·ç´Â ¼½¼Ç 4¿¡¼­´Â, ´ç½ÅÀÌ °ü·Ã ¹®¼­µéÀ» ÀоîºÃÀ¸¸ç, ³ëµå(Node) µî°ú °°Àº °Í¿¡ Ä£¼÷ÇÏ´Ù°í °¡Á¤ÇÒ°ÍÀÌ´Ù. ±×·¯³ª ¼½¼Ç 3À» À§ÇØ Æ¯º°È÷ Java SAX µµ±¸¿¡ ´ëÇÑ °æÇèÀ» ¿ä±¸ÇÏÁö´Â ¾Ê´Â´Ù. °ü·Ã ȨÆäÀÌÁö XML Toolkit ÀÇ ¼³Ä¡ Windows »ç¿ëÀÚ´Â http://sourceforge.net/projects/pyxml ¿¡¼­ ÆÐÅ°Áö¸¦, Mac »ç¿ëÀÚ´Â XXX ¿¡¼­ ÆÐÅ°Áö¸¦ ãÀ»¼öÀÖ´Ù. Linux »ç¿ëÀÚ´Â µ¥ºñ¾È¸¦ »ç¿ëÇÑ´Ù¸é XXX ¿¡¼­, RPM À» »ç¿ëÇÑ´Ù¸é http://sourceforge.net/projects/pyxml ¿¡¼­ ´Ù¿î¹ÞÀ» ¼ö ÀÖÀ»°ÍÀÌ´Ù. Unix Ç÷§Æû»ó¿¡¼­ ¼Ò½º¸¦ ÄÄÆÄÀÏ Çϱâ À§Çؼ­´Â ´ÙÀ½ÀÇ ¼³Ä¡¼ø¼­¸¦ µû¶óÇÏ¸é µÉ°ÍÀÌ´Ù. ¸¸ÀÏ Python 1.5 ¹öÀüÀ» »ç¿ëÇÑ´Ù¸é, ¸ÕÀú distutils À» ¼³Ä¡ÇؾßÇÑ´Ù. ÀÌ°ÍÀº http://www.python.org/sigs/distutils-sig¿¡¼­ ãÀ» ¼ö ÀÖ´Ù. Python 1.6 ÀÌÈÄÀÇ ¹öÀü¿¡¼­´Â distutils ÀÌ Æ÷ÇԵǾî ÀÖÀ¸¹Ç·Î, ÀÌ ´Ü°è´Â °Ç³Ê¶Ù¾îµµ µÈ´Ù. http://sourceforge.net/projects/pyxml¿¡¼­ ¼Ò½º¸¦ ´Ù¿î¹Þ¾Æ ´ÙÀ½°ú °°ÀÌ ¾ÐÃàÀ» Ǭ´Ù. gzip -dc xml-package.tgz | tar -xvf - ´ÙÀ½À» ½ÇÇàÇÑ´Ù.: python setup.py install ÀÌ ¸í·ÉÀ» ½ÇÇàÇϱâ À§Çؼ­´Â, ÀûÀýÇÑ C ÄÄÆÄÀÏ·¯°¡ ÇÊ¿äÇϸç, Unix ½Ã½ºÅÛ¿¡¼­ ½´ÆÛÀ¯ÀúÀÇ ±ÇÇÑÀ¸·Î À̸¦ ½ÇÇàÇÏ¿©¾ß ÇÒ°ÍÀÌ´Ù. setup.py ´Â ¸î°¡Áö ¼­·Î´Ù¸¥ ¸í·É°ú ¿É¼ÇÀ» Á¦°øÇϴµ¥, ÀÌ¿¡ ´ëÇؼ­´Â ¾Æ¹«·± ¿É¼Ç¾øÀÌ setup.py ¸¦ ½ÇÇàÇÏ¸é µµ¿ò¸»ÀÌ ³ª¿Ã°ÍÀÌ´Ù. ¸¸ÀÏ ¼³Ä¡¿¡ ¾î·Á¿òÀÌ ÀÖ´Ù¸é, <xml-sig@python.org>·Î ¹®Á¦¸¦ Àû¾î º¸³»Áֱ⠹ٶõ´Ù. ¶Ç´Â http://sourceforget.net/projects/pyxml·Î ¹ö±×¸®Æ÷ÆÃÀ» ÇØÁ־ µÈ´Ù. ¹èÆ÷µÇ´Â ¼Ò½ºÀÇ demo/ µð·ºÅ丮¿¡ ¸¹Àº µ¥¸ð ÇÁ·Î±×·¥µéÀÌ ÀÖ´Ù. ÀÌ ÇÁ·Î±×·¥µéÀ» ÅëÇØ, XML Åø·Î °¡´ÉÇÑ ÀÏÀÌ ¹«¾ùÀÎÁö »ìÆ캸°Å³ª, ¿¹Á¦ ¼Ò½ºµéÀ» ¾òÀ» ¼ö ÀÖÀ»°ÍÀÌ´Ù. °ü·Ã ȨÆäÀÌÁö http://www.python.org/topics/xml/ ÆÄÀ̽ãÀÇ XML ÅäÇÈÀ¸·Î ¸ðµç ¼ÒÇÁÆ®¿þ¾î, ¸ÞÀϸµ ¸®½ºÆ®, ¹®¼­µîÀÇ ¾÷µ¥ÀÌÆ®µéÀ» »ìÆ캼 ¼ö ÀÖÀ»°ÍÀÌ´Ù. SAX: The Simple API for XML SAX ´Â xml-dev ¸ÞÀϸµ ¸®½ºÆ®¸¦ ÅëÇÑ ¸¹Àº »ç¶÷µéÀÇ Á¶¾ðÀ» ÅëÇØ, David Megginson ÀÌ °³¹ßÇÏ¿´´Ù. SAX ´Â XML ÀÇ ÆĽ̿¡ ´ëÇØ À̺¥Æ®-±¸µ¿(event-driven) ÀÎÅÍÆäÀ̽º¸¦ °®´Â´Ù. SAX ¸¦ »ç¿ëÇϱâ À§Çؼ­, ÀûÀýÇÑ ÀÎÅÍÆäÀ̽º°¡ ¼±¾ðµÈ ÆÄÀ̽ã Ŭ·¡½º ÀνºÅϽº¸¦ Çϳª »ý¼ºÇÏ°í, ÀÌ ¿ÀºêÁ§Æ®ÀÇ ÀûÀýÇÑ ¸Þ½îµå¸¦ È£ÃâÇÔÀ¸·Î¼­ ÆĽÌÀ» ÇÏ°Ô µÈ´Ù. ÀÌÀü ¹öÀüÀÇ ¹®¼­¿¡¼­´Â SAX1 À» ¼³¸íÇÏ¿´Áö¸¸, À̹ø ÇÏ¿ìÅõ¿¡¼­´Â SAX ¹öÀü 2 (SAX2) ¸¦ °¡Áö°í ¼³¸íÀ» ÇÑ´Ù. SAX ´Â óÀ½ºÎÅÍ ³¡±îÁö ±¸¼ºµÈ XML ¹®¼­¸¦ Àоîµé¿©, ´Ù¸¥ ¹®¼­·Î º¯È¯ÇϱâÀ§ÇØ ¿¬»êÇϰųª, ±× ¹®¼­ÀÇ Á¤º¸µéÀ» Á¤¸®ÇÏ´Â (¿¹¸¦µé¾î ƯÁ¤ ¿ä¼ÒÀÇ Æò±Õ°ªµîÀ» °è»êÇÏ´Â ÀÛ¾÷) µî¿¡ ÀûÇÕÇÏ´Ù. ±×·¯³ª, °£´ÜÇÑ ¿ä¼ÒÀÇ ³»¿ëÀ̳ª ¼Ó¼ºÀ» ´Ù¸¥°ªÀ¸·Î ¹Ù²Ù´Â µîÀÇ °£´ÜÇÑ ¸ñÀû¿¡ »ç¿ëµÉ¼ö´Â À־, ÁßøµÈ ¾î¶°ÇÑ ¿ä¼ÒµéÀ» ±³È¯ÇÑ´Ù´øÁö ÇÏ´Â º¹ÀâÇÑ ¿¬»êµîÀÇ ¹®¼­±¸Á¶ º¯È¯¿¡´Â ÀûÇÕÇÏÁö ¾Ê´Ù. ¿¹¸¦ µé¾î, SAX ¸¦ »ç¿ëÇÏ¿© ¼Ó¼º°ªÀÌ 'greek'ÀÎ ¾î¶² ¿ä¼ÒÀÇ ³»¿ëÀ» Greek ¹®ÀÚ·Î º¯È¯ÇÏ´Â µîÀÇ ÀÛ¾÷¿¡´Â ÀûÇÕÇÏÁö¸¸, Àüü Ã¥ÀÇ Ã©Å͸¦ Àç¹èÄ¡ÇÑ´Ù´Â µîÀÇ ÀÛ¾÷Àº ÀûÇÕÇÏÁö ¾Ê´Ù. SAX ÀÇ ÀåÁ¡Àº ¼Óµµ¿Í ´Ü¼øÇÔ¿¡ ÀÖ´Ù. ¸¸È­Ã¥µéÀ» ³ª¿­Çϱâ À§ÇÑ DTD °¡ Á¤ÀǵǾî ÀÖ´Ù°í °¡Á¤ÇÏ°í, ´ç½ÅÀÌ ´ç½ÅÀÌ ¼ÒÀåÇÏ°í ÀÖ´Â ¸¸È­Ã¥Áß¿¡¼­ ÀúÀÚ(writer)°¡ Neil Gaiman ÀÎ ¸ðµç°ÍÀ» ãÀ¸·Á ÇÑ´Ù°í ÇÏÀÚ. ÀÌ·¯ÇÑ Æ¯Á¤ÇÑ ÀÏ¿¡ ´ëÇؼ­, °Ë»ö¿¡ °ü·ÃÀÌ ¾ø´Â ¹Ì¼ú°¡(artist)³ª ÆíÁýÀÚ(editor), ä»ö°¡(colourist) µîÀÇ ¿ä¼Ò¿¡ ´ëÇÑ ¼³¸íÀ» È®ÀåÇÒ ÇÊ¿ä´Â ¾ø´Ù. ±×·¯¹Ç·Î ÀÌ·²¶§¿¡´Â ¿ä¼ÒÁß ÀúÀÚ(writer)¸¦ Á¦¿ÜÇÑ ³ª¸ÓÁö ¿ä¼Ò´Â ¹«½ÃÇϵµ·Ï Ŭ·¡½º ÀνºÅϽº¸¦ ÀÛ¼ºÇÏ¸é µÈ´Ù. ¶Ç´Ù¸¥ ÀÌÁ¡Àº, ƯÁ¤½ÃÁ¡¿¡ ÀÖ¾î ¸ðµç ¹®¼­ÀÇ ³»¿ëÀ» ¸Þ¸ð¸®¿¡ ¿Ã¸®Áö ¾Ê¾Æµµ µÈ´Ù´Â °ÍÀÌ´Ù. ÀÌ°ÍÀº ¸Å¿ì Å« ¹®¼­¸¦ ó¸®ÇÒ¶§ ¸Å¿ì À¯¿ëÇÒ°ÍÀÌ´Ù. SAX ´Â 4°³ÀÇ ±âº»ÀûÀÎ ÀÎÅÍÆäÀ̽º¸¦ °¡Áö°í ÀÖ´Ù. SAX ¸¦ µû¸£´Â Æļ­´Â µ¥ÀÌÅ͸¦ ó¸®Çϱâ À§ÇØ ´Ù¾çÇÑ ¸Þ½îµå¸¦ È£ÃâÇϸç, ÀÌ·¯ÇÑ ÀÎÅÍÆäÀ̽º¸¦ Áö¿øÇÏ´Â ¾î¶°ÇÑ ¿ÀºêÁ§Æ®µµ ³Ñ°Ü¹ÞÀ» ¼ö ÀÖ´Ù. ±×·¯¹Ç·Î, ´ç½ÅÀÇ ÀÛ¾÷¿¡ ´ç½ÅÀÇ ¾îÇø®ÄÉÀ̼ǰú °ü·ÃµÈ ÀÎÅÍÆäÀ̽º¸¦ ÀÌ¿ëÇÏ¸é µÉ°ÍÀÌ´Ù. SAX ÀÎÅÍÆäÀ̽º´Â ´ÙÀ½°ú °°´Ù.: Interface Purpose ContentHandler ÀÌ ÀÎÅÍÆäÀ̽º´Â SAX ÀÇ ÇÙ½ÉÀ¸·Î, ÀϹÝÀûÀÎ ¹®¼­ À̺¥Æ®¸¦ À§ÇÑ È£ÃâÀÌ´Ù. ÀÌ ¸Þ½îµå´Â ¹®¼­ÀÇ ½ÃÀÛ, ¿ä¼ÒÀÇ ½ÃÀÛ°ú ³¡, ¿ä¼Ò°¡ Æ÷ÇÔÇÏ´Â ³»¿ëÀÇ ¹®ÀÚ¸¦ ¸¸³¯¶§ È£ÃâÀ» ÇÑ´Ù. DTDHandler ±âº»ÀûÀÎ ÆĽ̿¡ ÀÖ¾î ¿ä±¸µÇ´Â DTD À̺¥Æ®¸¦ Çڵ鸵Çϱâ À§ÇØ È£ÃâµÈ´Ù. Áï Ç¥±â¹ý(XML spec section 4.7)°ú ÆĽ̵ÇÁö ¾Ê´Â ¿£Æ¼Æ¼(entity) ¼±¾ð(XML spec section 4)À»¸¸³­¶§ È£ÃâÀ» ÇÑ´Ù. EntityResolver ¿ÜºÎ ¿£Æ¼Æ¼¸¦ ÂüÁ¶Çϱâ À§ÇÏ¿© »ç¿ëµÈ´Ù.¸¸ÀÏ ¹®¼­¿¡ ¿ÜºÎ ¿£Æ¼Æ¼ ÂüÁ¶°¡ ¾ø´Ù¸é, ÀÌ ÀÎÅÍÆäÀ̽º¸¦ ½ÇÇàÇÒ ÇÊ¿ä°¡ ¾øÀ»°ÍÀÌ´Ù. ErrorHandler ¿¡·¯¸¦ ó¸®Çϱâ À§ÇØ È£ÃâÇÑ´Ù.Æļ­´Â ¸ðµç °æ°í¿Í ¿¡·¯¸¦ º¸°íÇϱâ À§ÇØ ÀÌ ÀÎÅÍÆäÀ̽º¸¦ ÅëÇØ ¸Þ½îµå¸¦ È£ÃâÇÑ´Ù. ÆÄÀ̽ãÀº ÀÎÅÍÆäÀ̽º¿¡ ´ëÇÑ ³»¿ëÀ» Áö¿øÇÏÁö ¾ÊÀ¸¹Ç·Î À§ÀÇ ÀÎÅÍÆäÀ̽º´Â ÆÄÀ̽ã Ŭ·¡½º·Î ÀçÁ¤ÀÇ µÇ¾î¾ß ÇÑ´Ù. ±âº»ÀûÀ¸·Î ¸Þ½îµå´Â ¾Æ¹«·± Àϵµ ÇÏÁö ¾Ê´Â´Ù.(¸Þ½îµåÀÇ ³»¿ëÀº ÆÄÀ̽ãÀÇ pass ¸í·ÉÀ¸·Î µÇ¾îÀÖ´Ù.) ±×·¯¹Ç·Î ¾îÇø®ÄÉÀ̼ǿ¡¼­ »ç¿ëÇÏÁö ¾Ê´Â ¸Þ½îµå¿¡ ´ëÇؼ­´Â ´Ü¼øÈ÷ ¹«½ÃÇØ ¹ö¸®¸é µÈ´Ù. ¿©±â SAX ¸¦ »ç¿ëÇÏ´Â ½´µµÄÚµåÀÇ ¿¹°¡ ÀÖ´Ù : # Çڵ鷯 Ŭ·¡½ºÀÇ Á¤ÀÇ from xml.sax import Contenthandler, ... class docHandler(ContentHandler): ... # Çڵ鷯 Ŭ·¡½ºÀÇ ÀνºÅϽº »ý¼º dh = docHandler() # XML parser »ý¼º parser = ... # Æļ­¿¡ Çڵ鷯 ÀνºÅϽº¸¦ ÁöÁ¤ parser.setContentHandler(dh) # ÆÄÀÏ ÆĽÌ; Çڵ鷯 ¸Þ¼Òµå°¡ È£ÃâµÉ°ÍÀÌ´Ù. parser.parse(sys.stdin) Starting Out ¸¸È­Ã¥µé¿¡ ´ëÇÑ Á¤º¸¸¦ ÀúÀåÇÏ´Â °£´ÜÇÑ XML Æ÷¸Ë¿¡ ´ëÇØ »ý°¢Çغ¸ÀÚ. Çѱǿ¡ ´ëÇÑ °£´ÜÇÑ ¹®¼­°¡ ¿©±â ÀÖ´Ù. : <collection> <comic title="Sandman" number='62'> <writer>Neil Gaiman</writer> <penciller pages='1-9,18-24'>Glyn Dillon</penciller> <penciller pages="10-17">Charles Vess</penciller> </comic> </collection> XML ¹®¼­´Â ¹Ýµå½Ã ÇϳªÀÇ ÃÖ»óÀ§ ¿ä¼Ò¸¦ °¡Áö°í ÀÖ¾î¾ßÇÑ´Ù. ¿©±â¼­´Â "collection" ÀÌ ÃÖ»óÀ§ ¿ä¼ÒÀÌ´Ù. ÀÌ°ÍÀº ÇϳªÀÇ ÀÚ½Ä ¿ä¼ÒÀÎ comic À» °®´Â´Ù. comic ¿ä¼ÒÀÇ ¼Ó¼ºÀ¸·Î Ã¥ÀÇ Á¦¸ñ(title)°ú ¹øÈ£(number)°¡ ÁÖ¾îÁ³À¸¸ç, ÀúÀÚ(writer)¿Í ¹Ì¼ú°¡(artist)¿¡ ´ëÇØ Çϳª ¶Ç´Â ±×ÀÌ»óÀÇ ÀÚ½ÄÀ» °¡Áö°í ÀÖ´Ù. ÇϳªÀÇ °£Ç๰(issue)¿¡ ´ëÇØ ¿©·¯¸íÀÇ ¹Ì¼ú°¡(artist) ³ª ÀúÀÚ(writer)°¡ ÀÖÀ»¼ö ÀÖ´Ù. °£´ÜÇÑ »óÅ·Π½ÃÀÛÀ» Çغ¸ÀÚ : FindIssue ¶ó À̸§ Áö¾îÁø ¹®¼­Çڵ鷯(document handler)´Â ÁÖ¾îÁø °£Ç๰ÀÌ Ä÷¢¼Ç ³»¿¡ ÀÖ´ÂÁö ã´ÂÀÏÀ» ÇÒ°ÍÀÌ´Ù. from xml.sax import saxutils class FindIssue(saxutils.DefaultHandler): def __init__(self, title, number): self.search_title, self.search_number = title, number DefaultHandler Ŭ·¡½º´Â ³×°³ÀÇ ÀÎÅÍÆäÀ̽º - ContentHandler, DTDHandler, EntityResolver, ±×¸®°í ErrorHandler ¿¡¼­ »ó¼ÓÀ» ¹Þ´Â´Ù. ÀÌ°ÍÀº ¸ðµç°ÍÀ» ÇϳªÀÇ Å¬·¡½º ³»¿¡¼­ »ç¿ëÇÏ±æ ¿øÇÒ¶§ »ç¿ëÇÏ´Â ¹æ¹ýÀÌ´Ù. ¸¸ÀÏ °¢°¢ÀÇ ¸ñÀû¿¡ µû¶ó Ŭ·¡½º¸¦ ³ª´©±æ ¿øÇϰųª, ÇϳªÀÇ ÀÎÅÍÆäÀ̽º¸¸À» ¼±¾ðÇÏ±æ ¿øÇÑ´Ù¸é, °¢ ÀÎÅÍÆäÀ̽º¿¡ µû¶ó °¢°¢ ¼­ºêŬ·¡½º¸¦ ¸¸µé¼ö ÀÖ´Ù. ÀÌÁß¿¡ ¾î´À ¹æ¹ýÀÌ ´õ ÁÁ´Ù°í ÇÒ¼ö´Â ¾øÀ¸¸ç, ¹«¾ùÀ» ÇÒ°ÍÀΰ¡¿¡ µû¶ó ÀûÀýÇÑ ¹æ¹ýÀ» ÅÃÇÏ¸é µÉ°ÍÀÌ´Ù. Ŭ·¡½º°¡ °Ë»öÀ» Çϱâ À§Çؼ­, ÀνºÅϽº´Â ¹«¾ùÀ» °Ë»öÇÒ°ÍÀÎÁö¸¦ ¾Ë¾Æ¾ßÇÑ´Ù. ã±â¸¦ ¿øÇÏ´Â title °ú ¹ßÇ๰ ¹øÈ£´Â FindIssue »ý¼ºÀÚ¿¡°Ô °Ç³»Áö°í, ÀνºÅϽºÀÇ ÀϺηΠÀúÀåµÉ°ÍÀÌ´Ù. ÀÚ ÀÌÁ¦ ½ÇÁ¦·Î µ¿ÀÛÀ» ÇÏ´Â ÇÔ¼ö¸¦ »ìÆ캸µµ·Ï ÇÏÀÚ. ÀÌ °£´ÜÇÑ ÀÛ¾÷Àº ´ÜÁö ÁÖ¾îÁø ¿ä¼ÒÀÇ ¼Ó¼ºÀ» »ìÆ캸´Â °ÍÀ̹ǷΠstartElement ¸Þ¼Òµå°¡ ÀûÇÕÇÒ °ÍÀÌ´Ù. def startElement(self, name, attrs): # comic ¿ä¼Ò°¡ ¾Æ´Ï¸é ¹«½ÃÇ϶ó. if name != 'comic': return # title °ú number ¼Ó¼º¿¡ ´ëÇØ °Ë»öÀ» ÇÑ´Ù. title = attrs.get('title', None) number = attrs.get('number', None) if title == self.search_title and number == self.search_number: print title, '#'+str(number), 'found' startElement() ¸Þ½îµå¿¡´Â ÁÖ¾îÁø ¿ä¼ÒÀÇ À̸§°ú ±× ¿ä¼ÒÀÇ ¼Ó¼ºÀ» °®´Â ÀνºÅϽº°¡ ÀüÇØÁø´Ù. ¸¶Áö¸· AttributeList ÀÎÅÍÆäÀ̽º´Â ÆÄÀ̽㠻çÀüÇüÀÌ´Ù. ±×·¯¹Ç·Î ÇÔ¼ö´Â ¸ÕÀú comic ¿ä¼ÒÀÎÁö È®ÀÎÇÏ°í, ƯÁ¤ title °ú number ¼Ó¼ºÀ» °Ë»öÇÏ°Ô µÈ´Ù. ºñ±³¿¡ ¼º°øÇÏ¸é ¸Þ¼¼Áö°¡ Ãâ·ÂµÈ´Ù. startElement() ´Â ¹®¼­ÀÇ ¸ðµç ¿ä¼Ò¸¦ ¸¸³¯¶§¸¶´Ù È£ÃâµÈ´Ù. startElement() ÇÔ¼öÀÇ Ã³À½¿¡ 'Starting element:' ¸¦ Ãâ·ÂÇϵµ·Ï Äڵ带 Áý¾î³Ö´Â´Ù¸é, ´ÙÀ½°ú °°Àº Ãâ·ÂÀ» º¸°Ô µÉ°ÍÀÌ´Ù. Starting element: collection Starting element: comic Starting element: writer Starting element: penciller Starting element: penciller ½ÇÁ¦ Ŭ·¡½º¸¦ »ç¿ëÇϱâ À§Çؼ­, parser ¿Í FindIssue ÀνºÅϽº¸¦ »ý¼ºÇÏ°í À̵éÀ» ¿¬°áÇÏ°í, ÀԷ°ªÀ» ÆĽÌÇϵµ·Ï Æļ­¸¦ È£ÃâÇÏ´Â ÃÖ»óÀ§ Äڵ尡 ÇÊ¿äÇÏ´Ù. from xml.sax import make_parser from xml.sax.handler import feature_namespaces if __name__ == '__main__': # Æļ­ÀÇ »ý¼º parser = make_parser() # Æļ­¿¡°Ô XML À̸§¿µ¿ªÀº ¹«½ÃÇϵµ·Ï ÀüÇÑ´Ù. parser.setFeature(feature_namespaces, 0) # handler ÀÇ »ý¼º dh = FindIssue('Sandman', '62') # Æļ­¿¡ ¿ì¸®°¡ ¸¸µç Çڵ鷯¸¦ »ç¿ëÇϵµ·Ï ÀüÇÑ´Ù. parser.setContentHandler(dh) # ÀÔ·ÂÀ» ÆĽÌÇÑ´Ù. parser.parse(file) make_parser Ŭ·¡½º´Â Æļ­¸¦ ¸¸µå´Â ÀÛ¾÷À» ÀÚµ¿À¸·Î ÇØÁØ´Ù. ÆÄÀ̽㿡´Â ÀÌ¹Ì ¿©·¯°¡Áö XML Æļ­°¡ Á¸ÀçÇϸç, ¾ÕÀ¸·Îµµ ¸¹Àº Æļ­°¡ Ãß°¡µÉ ¿¹Á¤ÀÌ´Ù. ÆÄÀ̽ã 1.5 ¹öÀü¿¡ ÀÖ´Â xmllib.py ´Â Ưº°È÷ ºü¸£Áö´Â ¾ÊÁö¸¸, ÇöÀçµµ »ç¿ë°¡´ÉÇÏ´Ù. xmllib.py ÀÇ ¼Óµµ¸¦ °³¼±ÇÑ ¹öÀüÀÌ xml.parsers ¿¡ Æ÷ÇԵǾîÀÖ´Ù. xml.parsers.expat ¸ðµâÀº Áö±Ý±îÁö´Â °¡Àå ºü¸£¸ç, °¡´ÉÇÏ´Ù¸é ÀÌ°ÍÀÌ ¼±ÅõȴÙ. make_parser ´Â ¾î¶² Æļ­°¡ »ç¿ë°¡´ÉÇÑÁö¸¦ °áÁ¤ÇÏ°í, °¡Àå ºü¸¥ Æļ­¸¦ ¼±ÅÃÇÑ´Ù. ±×·¯¹Ç·Î, °¢ Æļ­µéÀÌ ¾î¶»°Ô ´Ù¸¥Áö¿¡ ´ëÇؼ­´Â »ç¿ëÀÚ°¡ ¾Ë°í ÀÖ¾î¾ß ÇÒ ÇÊ¿ä°¡ ¾ø´Ù. (make_parser ¿¡ ´ç½ÅÀÌ »ç¿ëÇϱ⸦ ¿øÇÏ´Â Æļ­ ¸®½ºÆ®¸¦ ¾Ë·ÁÁÙ¼öµµ ÀÖ´Ù.) SAX2 ¿¡¼­ºÎÅÍ, XML À̸§¿µ¿ª(namespace)ÀÌ Áö¿øµÈ´Ù. ¸¸ÀÏ À̸§¿µ¿ª ÇÁ·Î¼¼½ÌÀÌ ¿¢Æ¼ºê µÇ¾îÀÖ´Ù¸é, startElement ´ë½Å startElementNS ÀÌ È£ÃâµÈ´Ù. content Çڵ鷯°¡ À̸§¿µ¿ª¿¡ ´ëÇÑ ¸Þ¼Òµå¸¦ Á¤ÀÇÇÏÁö ¾Ê¾Ò´Ù¸é, À̸§¿µ¿ª 󸮸¦ ÇÏÁö ¾Ê°Ú´Ù°í ¿ä±¸ÇÏ´Â °ÍÀÌ´Ù. ÀÌ ¼³Á¤ÀÇ ±âº»Àº Æļ­¿¡¼­ Æļ­·Î ¼öÁ¤À» °¡ÇÑ´Ù. ±×·¯¹Ç·Î ¾ÈÀüÇÑ °ªÀ¸·Î ¼³Á¤À» Çϴ°ÍÀÌ ÁÁ´Ù. Æļ­ ÀνºÅϽº¸¦ »ý¼ºÇÑ ÈÄ, setContentHandler ¸¦ È£ÃâÇÏ¿© Æļ­¿¡°Ô »ç¿ëÇÒ Çڵ鷯¸¦ ³Ñ°ÜÁØ´Ù. ¿¹Á¦ XML ¹®¼­¸¦ À§ÀÇ Äڵ忡 ´ëÀÔÇϸé, Ãâ·ÂÀ¸·Î 'Sandman #62 found' °¡ ³ª¿Ã°ÍÀÌ´Ù. Error Handling ÀÌÁ¦ À§ÀÇ Äڵ忡 ¾Æ·¡ÀÇ ÆÄÀÏÀ» ÀÔ·ÂÀ¸·Î ³Ö¾îº¸ÀÚ: <collection> &foo; <comic title="Sandman" number='62'> </collection> &foo; ¿£Æ¼Æ¼´Â ¾Ë·ÁÁöÁö ¾ÊÀº°ÍÀ̸ç, comic ¿ä¼Ò´Â ´ÝÈ÷Áö ¾Ê¾Ò´Ù. (¸¸ÀÏ ºó ³»¿ëÀ» °®´Â´Ù ÇÏ´õ¶óµµ ">" ·Î ´Ý±â Àü¿¡ "/" ¸¦ »ç¿ëÇÏ¿©¾ß ÇÑ´Ù.) ÀÌ·¯ÇÑ °á°ú·Î, SAXParseException ÀÌ ¹ß»ýÇÑ´Ù. xml.sax._exceptions.SAXParseException: undefined entity at None:2:2 ErrorHandler ÀÎÅÍÆäÀ̽ºÀÇ ±âº»ÄÚµå´Â ¾î¶°ÇÑ ¿¡·¯¿¡ ´ëÇؼ­µµ ÀÚµ¿ÀûÀ¸·Î ¿¹¿Ü¸¦ ¹ß»ý½ÃŲ´Ù; ¸¸ÀÏ ÀÌ·¯ÇÑ ¿¡·¯Ã³¸®¸¦ ¿øÇÑ´Ù¸é, ¿¡·¯ Çڵ鷯¸¦ ¼öÁ¤ÇÒ ÇÊ¿ä°¡ ¾øÀ»°ÍÀÌ´Ù. ¶ÇÇÑ, ÀÚ±â ÀڽŸ¸ÀÇ ErrorHandler ÀÎÅÍÆäÀ̽º³ª, error(), fatalError() ¿¡ ´ëÇÑ ÃÖ¼ÒÇÑÀÇ ¿À¹ö¶óÀ̵带 ¸¸µé¼öµµ ÀÖ´Ù. °¢ ¸Þ¼Òµå´Â ÃÖ¼Ò·Î ÇÑ ÁÙ Àϼöµµ ÀÖ´Ù. warning, error, fatalError ¿¡ ´ëÇÑ ErrorHandler ÀÎÅÍÆäÀ̽º ¸Þ½îµå´Â ¸ðµÎ ÇϳªÀÇ ÀÎÀÚ°ª - exception ÀνºÅϽº¸¦ °®´Â´Ù. exception Àº Ç×»ó SAXException ÀÇ ¼­ºêŬ·¡½ºÀ̸ç, str() ¸¦ ÀÌ¿ëÇÏ¿© ÀÐÀ»¼öÀÖ´Â ¹®Á¦Á¡À» ¼³¸íÇÏ´Â ¿¡·¯ ¸Þ¼¼Áö·Î ¸¸µé¼öÀÖ´Ù. ´ÙÀ½Àº, ¿©·¯°¡Áö ¿¡·¯¹ß»ý »óȲÀ» Àç¼³Á¤Çϱâ À§ÇØ, ¼¼°¡ÁöÁß ÇϳªÀÇ ¸Þ¼Òµå¸¦ ¿¹¿Ü¸¦ Ãâ·ÂÇϵµ·Ï Á¤ÀÇÇÏ¿´´Ù: def error(self, exception): import sys sys.stderr.write("\%s\n" \% exception) ÀÌ Á¤ÀÇ¿¡ ÀÇÇϸé, Ä¡¸íÀûÀÌÁö ¾ÊÀº error ´Â ¿¡·¯ ¸Þ¼¼Áö¸¦ Ãâ·ÂÇÏ°Ô µÇÁö¸¸, Ä¡¸íÀûÀÎ ¿¡·¯(fatal error) ´Â Æ®·¹À̽º¹é(traceback)À» »ý¼ºÇÏ´Â ÀÏÀ» °è¼ÓÇÒ °ÍÀÌ´Ù. Searching Element Content ƯÁ¤ ÀúÀÚ(author) °¡ ¾´ ¸ðµç ¹ßÇ๰(issue) ¸¦ Ãâ·ÂÇÏ´Â, Á¶±Ý´õ º¹ÀâÇÑ ÀÛ¾÷À» Çغ¸ÀÚ. Let's tackle a slightly more complicated task, printing out all issues written by a certain author. ÀÌ°ÍÀº ÀúÀÚÀÇ À̸§ÀÌ <writer>Peter Milligan</writer> °ú °°ÀÌ writer ¿ä¼ÒÀÇ ³»ºÎ¿¡ Á¸ÀçÇϹǷÎ, ¿ä¼ÒÀÇ ³»¿ëÀ» °Ë»öÇؾßÇÑ´Ù. ÀÌ·¯ÇÑ °Ë»öÀº ´ÙÀ½°ú °°Àº ¾Ë°í¸®ÁòÀ» µû¶ó 󸮵ȴÙ: startElement ¸Þ½îµå´Â Á¶±Ý´õ º¹ÀâÇÏ°Ô µÈ´Ù. comic ¿ä¼Ò¿¡ ´ëÇØ, °Ë»ö±âÁØ¿¡ ÀûÇÕÇÑ comic À» ³ªÁß¿¡ ã±âÀ§ÇØ, Çڵ鷯´Â title °ú number ¸¦ ÀúÀåÇÏ¿©¾ßÇÑ´Ù. writer ¿ä¼Ò¿¡ ´ëÇؼ­´Â, inWriterContent Ç÷¡±×¸¦ ÂüÀ¸·Î ¼³Á¤ÇÏ°í, writerName ¼Ó¼ºÀ» ºó ¹®ÀÚ¿­·Î ¼³Á¤ÇÑ´Ù. XML ű׹ÛÀÇ ¹®ÀÚµé(Characters)À» ó¸®ÇÏ¿©¾ß ÇÑ´Ù. inWriterContent °¡ ÂüÀ̸é, ÀÌ ¹®ÀÚµéÀ» writeName ¹®ÀÚ¿­¿¡ Ãß°¡ÇÑ´Ù. writer ¿ä¼Ò°¡ ³¡³ª¸é, writerName ¼Ó¼º¾ÈÀÇ ¸ðµç ¿ä¼ÒÀÇ ³»¿ëÀ» ¼öÁýÇÑ°ÍÀÌ µÈ´Ù. ±×·¯¹Ç·Î, ã°íÀÚÇÏ´Â name °ú µ¿ÀÏÇÑ°ÍÀÎÁö °Ë»çÇÏ°í, ¸¸ÀÏ ¸Â´Â´Ù¸é, ÀÌ comic ¿¡ ´ëÇÑ Á¤º¸¸¦ Ãâ·ÂÇÑ´Ù. ´Ù½Ã inWriterContent ¸¦ °ÅÁþÀ¸·Î ¼³Á¤ÇÑ´Ù. ¿©±â¿¡ ù¹ø° ºÎºÐÀÇ Äڵ尡 ÀÖ´Ù. from xml.sax import ContentHandler def normalize_whitespace(text): "¹®ÀÚ¿­¿¡¼­ Áߺ¹ÀûÀ¸·Î ³ªÅ¸³ª´Â °ø¹é¹®ÀÚ(whitespace)¸¦ Á¦°ÅÇÑ´Ù." return ' '.join(text.split()) class FindWriter(ContentHandler): def __init__(self, search_name): # ã°íÀÚ ÇÏ´Â À̸§À» ÀúÀåÇÑ´Ù. self.search_name = normalize_whitespace(search_name) # Ç÷¡±×¸¦ °ÅÁþ(false)À¸·Î ÃʱâÈ­ÇÑ´Ù. self.inWriterContent = 0 def startElement(self, name, attrs): # comic ¿ä¼ÒÀ̸é, title °ú issue ¸¦ ÀúÀåÇÑ´Ù. if name == 'comic': title = normalize_whitespace(attrs.get('title', "")) number = normalize_whitespace(attrs.get('number', "")) self.this_title = title self.this_number = number # writer ¿ä¼ÒÀÇ ½ÃÀÛÀ̸é, Ç÷¡±×¸¦ ¼³Á¤ÇÑ´Ù. elif name == 'writer': self.inWriterContent = 1 self.writerName = "" startElement() ¸Þ¼Òµå¿¡ ´ëÇؼ­´Â ÀÌÀü¿¡ ¼³¸íÇÏ¿´´Ù. ÀÌÁ¦ ¿ä¼ÒÀÇ ³»¿ëÀ» ¾î¶»°Ô ó¸®ÇÏ´ÂÁö º¸ÀÚ. normalize_whitespace() ÇÔ¼ö´Â ¸Å¿ì Áß¿äÇϹǷÎ, Äڵ峻¿¡ ÀÌ°ÍÀ» »ç¿ëÇÏ¿©¾ß ÇÑ´Ù. XML Àº °ø¹é¹®ÀÚ(whitespace) ¿¡ ¸Å¿ì ¹Î°¨ÇÏ´Ù; ´ç½ÅÀº ´ç½ÅÀÌ ¿øÇÏ´Â °÷¿¡ ¿©ºÐÀÇ °ø¹é°ú °³Ç๮ÀÚµéÀ» Æ÷ÇÔ½Ãų ¼ö ÀÖ´Ù. ÀÌ°ÍÀº ¼Ó¼º°ªÀ̳ª ¿ä¼ÒÀÇ ³»¿ëÀ» ºñ±³Çϱâ Àü¿¡, °ø¹é¹®ÀÚ¸¦ Á¤»óÀûÀ¸·Î ¸¸µé¾î¾ß ÇÔÀ» ÀǹÌÇÑ´Ù; ¸¸ÀÏ µÎ°³ÀÇ ¿ä¼ÒÀÇ ³»¿ëÀÌ ´Ù¸¥ ¼öÀÇ °ø¹é¹®ÀÚ¸¦ °®´Â´Ù¸é, ºñ±³¿¬»êÀº À߸øµÈ °á°ú¸¦ ¸¸µé¾î³¾ °ÍÀÌ´Ù. def characters(self, ch): if self.inWriterContent: self.writerName = self.writerName + ch characters() ¸Þ½îµå´Â XML ű׹ÛÀÇ ¹®ÀÚµéÀ» ¸¸³¯¶§ È£ÃâµÈ´Ù. ch ´Â ¹®ÀÚµéÀÇ ½ºÆ®¸µÀÌÁö¸¸, ¹Ýµå½Ã ¹ÙÀÌÆ® ½ºÆ®¸µÀΰÍÀº ¾Æ´Ï´Ù; Æļ­´Â ¹®¼­ÀÇ ÀϺκÐÀÎ ¹öÆÛ ¿ÀºêÁ§Æ®¸¦ Á¦°øÇϰųª, À¯´ÏÄÚµå ¿ÀºêÁ§Æ®¸¦ °Ç³»ÁÖ°Ô µÈ´Ù(ÆÄÀ̽ã 2.0 ÀÇ expat Æļ­). parsers may also provide a buffer object that is a slice of the full document, or they may pass Unicode objects (as the expat parser does in Python 2.0). ¸ðµç ¹®ÀÚµéÀÌ ÇѹøÀÇ ÇÔ¼ö È£Ãâ·Î ó¸®µÈ´Ù°í °¡Á¤ÇÏÁö ¸»±â ¹Ù¶õ´Ù. À§ÀÇ ¿¹¸¦ µé¾îº¸¸é, "Peter Milligan" ¶ó´Â ¹®ÀÚ¿­¿¡ ´ëÇØ ÇѹøÀÇ characters() È£ÃâÀÌ Àְųª, ¶Ç´Â °¢ ¹®ÀÚ¿¡ ´ëÇØ Çѹø¾¿ characters() ÀÇ È£ÃâÀÌ ÀÖÀ» ¼ö ÀÖ´Ù. ´õ¿í Çö½ÇÀûÀ¸·Î, ¸¸ÀÏ ³»¿ëÀÌ "Wagner &amp; Seagle" °ú °°ÀÌ ¿£Æ¼Æ¼ ÂüÁ¶¸¦ °¡Áö°í ÀÖ´Ù¸é, Æļ­´Â "Wagner ", ¿£Æ¼Æ¼ ÂüÁ¶¸¦ »ó¡ÇÏ´Â "&", ±×¸®°í " Seagle" ¿¡ ´ëÇØ °¢ ¼¼¹øÀÇ ¸Þ¼Òµå È£ÃâÀ» ÇÏ°Ô µÈ´Ù. FindWriter ÀÇ µÎ¹ø° °úÁ¤¿¡¼­, characters() ´Â ´ÜÁö inWriterContent ¸¦ °Ë»çÇÏ°í, ÀÌ °ªÀÌ ÂüÀ̸é, ¹®ÀÚ¸¦ ¹®ÀÚ¿­¿¡ Ãß°¡ÇÏ´Â ÀÛ¾÷À» ÇÑ´Ù. ¸¶Áö¸·À¸·Î, writer ¿ä¼Ò°¡ ³¡³¯¶§, Àüü À̸§ÀÌ ¼öÁýµÉ°ÍÀÌ°í, ÀÌ°ÍÀ» ¿ì¸®°¡ ã°íÀÚÇÏ´Â À̸§°ú ºñ±³ÇÏ°Ô µÈ´Ù. def endElement(self, name): if name == 'writer': self.inWriterContent = 0 self.writerName = normalize_whitespace(self.writerName) if self.search_name == self.writerName: print 'Found:', self.this_title, self.this_number ´Ù¸¥ °ø¹é¹®ÀÚ¼ö¿¡ ÀÇÇÑ È¥µ¿À» ¸·±âÀ§ÇØ, normalize_whitespace() ÇÔ¼ö°¡ È£ÃâµÇ¾ú´Ù. ÀÌ°ÍÀº ÀÌ DTD ³»¿¡¼­´Â, ÀÌ ¿ä¼Ò°¡ °¡Áö°í ÀÖ´Â °ø¹é¹®ÀÚ°¡ Áß¿äÇÏÁö ¾Ê±â ¶§¹®ÀÌ´Ù. ¸¶Ä§ ű×(End tags)´Â ¼Ó¼ºÀ» °¡Áú¼ö ¾øÀ¸¹Ç·Î, ¿©±â¿¡´Â attrs ÀÎÀÚ°¡ ¾ø´Ù. "<arc name="Season of Mists"/>" ¿Í °°ÀÌ ¼Ó¼ºÀ» °®´Â ºó ű״Â, startElement() ¸¦ È£ÃâÇÑ ÈÄ ¹Ù·Î endElement() ¸¦ È£ÃâÇÑ´Ù. XXX ¿ÜºÎ ¿£Æ¼Æ¼ 󸮴 ¾î¶»°Ô ÇÒ°ÍÀΰ¡? ±×µé¿¡ ´ëÇÑ Ã³¸®°¡ Ưº°È÷ ÇÊ¿äÇÑ°¡? °ü·Ã ȨÆäÀÌÁö http://www.megginson.com/SAX/ SAX ȨÆäÀÌÁö´Ù. ¿©±â¿¡´Â °¡Àå ÃÖ½ÅÀÇ ¸í¼¼¼­¿Í ´Ù¾çÇÑ ¾ð¾î¿Í Ç÷§Æû»óÀÇ SAX µµ±¸ ¸®½ºÆ®°¡ ÀÖ´Ù. ÇöÀç´Â ÀÚ¹Ù Áß½ÉÀûÀ¸·Î µÇ¾îÀÖ´Ù. DOM: The Document Object Model ¹®¼­ °´Ã¼ ¸ðµ¨(DOM)Àº XML ¹®¼­¸¦ Æ®¸®±¸Á¶ Ç¥ÇöÀ¸·Î ¸í½ÃÇÑ´Ù. ÃÖ»óÀ§ ¹®¼­ ÀνºÅϽº´Â Æ®¸®ÀÇ ·çÆ®À̸ç, ÇϳªÀÇ ÃÖ»óÀ§ ¿ä¼Ò ÀνºÅϽº(Element instance)¸¦ °®´Â´Ù.; ÀÌ ¿ä¼Ò´Â ³»¿ëÀ» Ç¥ÇöÇÏ´Â Àڽijëµå³ª, Ãß°¡ÀûÀÎ ÀÚ½ÄÀ» °®À» ¼ö ÀÖ´Â ÇÏÀ§¿ä¼Ò¸¦ °®´Â´Ù. ÇÔ¼öµéÀº °á°úÆ®¸®¸¦ Ž»öÇϰųª, ¿ä¼Ò¿Í ¼Ó¼º°ªÀ¸·ÎÀÇ Á¢±Ù, ³ëµåÀÇ Ãß°¡¿Í »èÁ¦, Æ®¸®¸¦ ´Ù½Ã XML ·Î º¯È¯ÇÏ´Â µîÀÇ ÀÛ¾÷µîÀ» Á¦°øÇÑ´Ù. DOM Àº, DOM Æ®¸®¸¦ ¸¸µé¾î »õ·Î¿î ³ëµå¸¦ Ãß°¡Çϰųª ÇÏÀ§Æ®¸®¸¦ ¿Å±äÈÄ, »õ·Î¿î XML ¹®¼­·Î °á°ú¸¦ Ãâ·ÂÇÒ¼öÀÖ°Ô ÇÔÀ¸·Î¼­, XML ¹®¼­ÀÇ ¼öÁ¤À» ½±°Ô ÇØÁØ´Ù. ¶ÇÇÑ ÀڽŸ¸ÀÇ DOM Æ®¸®¸¦ ¸¸µé°í, À̸¦ XML ·Î º¯È¯Çϴ°͵µ °¡´ÉÇÏ´Ù; ÀÌ ¹æ¹ýÀº ´Ü¼øÈ÷ ÆÄÀÏ¿¡ <tag1>...</tag1> ¸¦ ¾²´Â ¹æ¹ýº¸´Ù, XML À» »ý¼ºÇϴµ¥ ´õ¿í À¯¿¬ÇÑ ¹æ¹ýÀÌ´Ù. DOM Àº ÇѽÃÁ¡¿¡¼­ ¸ðµç Æ®¸®¸¦ ¸Þ¸ð¸®¿¡ »óÁÖ½ÃÅ°´Â°ÍÀ» ¿ä±¸ÇÏÁö ¾Ê´Â ¹Ý¸é¿¡, ÆÄÀ̽ã DOM µµ±¸´Â RAM ¿¡ ¸ðµç Æ®¸®¸¦ °¡Áö°í ÀÖ¾î¾ß ÇÑ´Ù. Æ®¸®ÀÇ ´ëºÎºÐÀ» µð½ºÅ©³ª µ¥ÀÌÅͺ£À̽º¿¡ Áý¾î³Ö°í, ÇÊ¿äÇÑ ¼½¼Ç¸¸À» ÀоîµéÀÌ´Â ¹æ¹ýÀÌ °¡´ÉÇÏ°ÚÁö¸¸, ÇöÀç·Î¼­´Â Áö¿øµÇÁö ¾Ê´Â´Ù. ÀÌ´Â ¿ë·®ÀÌ Å« ¹®¼­¸¦ DOM Æ®¸®·Î ó¸®ÇÒ¶§, ¸Þ¸ð¸®°¡ ºÎÁ·ÇÒ ¼öµµ ÀÖÀ½À» ³ªÅ¸³½´Ù. ¹Ý´ë·Î, SAX Çڵ鷯´Â °¡¿ëÇÑ RAM º¸´Ù Å« µ¥ÀÌÅ͸¦ ó¸®Çϴ°ÍÀÌ °¡´ÉÇÏ´Ù. Getting A DOM Tree DOM Æ®¸®¸¦ ¾ò´Â °¡Àå ½¬¿î ¹æ¹ýÀº ÀÚ±âÀÚ½ÅÀÌ ¸¸µå´Â°ÍÀÌ´Ù. PyXML Àº DOM À» À§ÇÑ µµ±¸·Î¼­ xml.dom.minidom °ú 4DOM À» Á¦°øÇÑ´Ù. xml.dom.minidom Àº ÆÄÀ̽ã 2.0 ¿¡ Æ÷ÇԵǾî ÀÖ´Ù. ÆÄÀ̽ã 2.0 ¿¡ Æ÷ÇԵǾî ÀÖ´Â xml.dom.minidom Àº ÃÖ¼ÒÇÑÀÇ µµ±¸·Î¼­, DOM Ç¥ÁØ¿¡¼­ ¿ä±¸ÇÏ´Â ¸ðµç ÀÎÅÍÆäÀ̽º¿Í ¿¬»êÀ» Á¦°øÇÏÁö ¾Ê´Â´Ù. 4DOM (XXX reference) Àº DOM Level 2 ¿¡ Ãæ½ÇÇÑ µµ±¸À̹ǷÎ, À̹ø ¿¹Á¦¿¡´Â ÀÌ°ÍÀ» »ç¿ëÇϵµ·Ï ÇÑ´Ù. xml.dom.package ³»ÀÇ ¸ðµâÁß xml.dom.ext.reader.Sax2 ´Â ÀÔ·Â(ÆÄÀÏ·ùÀÇ °´Ã¼, ½ºÆ®¸µ, ÆÄÀÏÀ̸§, URL µî)¿¡¼­ DOM Æ®¸®¸¦ ¸¸µé¾îÁÖ´Â, FromXmlStream, FromXml, FromXmlFile, ±×¸®°í FromXmlUrl ÇÔ¼ö¸¦ Á¦°øÇÑ´Ù. À̵éÀº ¸ðµÎ DOM ¹®¼­ °´Ã¼¸¦ ¹ÝȯÇÑ´Ù. import sys from xml.dom.ext.reader.Sax import FromXmlStream from xml.dom.ext import PrettyPrint # parse the document doc = FromXmlStream(sys.stdin) Manipulating The Tree DOM Àº ¼ö¸¹Àº ÀÎÅÍÆäÀ̽º¿Í ¸Þ½îµå¸¦ °¡Áö°í ÀÖÀ¸¹Ç·Î, ÀÌ HOWTO ¿¡¼­ ±× ¸ðµç°ÍÀ» ¼³¸íÇÒ ¼ö´Â ¾ø´Ù. ±×·¯³ª, ´ÙÇེ·´°Ôµµ, DOM ±Ç°í¾ÈÀº ¸Å¿ì °¡µ¶¼ºÀÌ ³ôÀº ¹®¼­À̹ǷÎ, °¡´ÉÇÑ ÀÎÅÍÆäÀ̽º¿¡ ´ëÇÑ ¿ÏÀüÇÑ ±×¸²À» ¾ò±â À§ÇØ ÀÌ°ÍÀ» Àб⸦ ±ÇÇÑ´Ù. ¿©±â¼­´Â ÀϺκÐÀÇ °³°ü¸¸À» º¸µµ·Ï ÇÑ´Ù. ¹®¼­ °´Ã¼ ¸ðµ¨(DOM)Àº XML ¹®¼­¸¦, ³ëµå Ŭ·¡½ºÀÇ ÇÏÀ§ Ŭ·¡½ºÀÇ ÀνºÅϽº·Î Ç¥ÇöµÇ´Â, ³ëµåµéÀÇ Æ®¸®·Î Ç¥ÇöÇÑ´Ù. ¾î¶°ÇÑ ³ëµåÀÇ ÇÏÀ§Å¬·¡½º´Â ¿ä¼Ò(Element), ÅؽºÆ®, ÁÖ¼®ÀÌ µÉ¼öµµ ÀÖ´Ù. ¿ì¸®´Â ÀÌ ¼½¼Ç³»¿¡¼­ ÇϳªÀÇ °£´ÜÇÑ ¿¹Á¦¹®¼­¸¦ »ç¿ëÇÒ °ÍÀÌ´Ù. ¿©±â¿¡ ±× ¿¹Á¦°¡ ÀÖ´Ù. <?xml version="1.0" encoding="iso-8859-1"?> <xbel> <?processing instruction?> <desc>No description</desc> <folder> <title>XML bookmarks</title> <bookmark href="http://www.python.org/sigs/xml-sig/" > <title>SIG for XML Processing in Python</title> </bookmark> </folder> </xbel> DOM Æ®¸®·Î º¯È¯Çϸé, ÀÌ ¹®¼­´Â ´ÙÀ½°ú °°Àº Æ®¸®·Î Ãâ·ÂµÈ´Ù : Element xbel None Text #text ' \012 ' ProcessingInstruction processing 'instruction' Text #text '\012 ' Element desc None Text #text 'No description' Text #text '\012 ' Element folder None Text #text '\012 ' Element title None Text #text 'XML bookmarks' Text #text '\012 ' Element bookmark None Text #text '\012 ' Element title None Text #text 'SIG for XML Processing in Python' Text #text '\012 ' Text #text '\012 ' Text #text '\012' ÀÌ°ÍÀº À¯ÀÏÇÏ°Ô °¡´ÉÇÑ Æ®¸®´Â ¾Æ´Ï´Ù. °¢±â ´Ù¸¥ Æļ­µéÀÌ ¾î¶»°Ô ÅؽºÆ® ³ëµåµéÀ» ó¸®ÇÏ´À³Ä¿¡ µû¶ó ´Þ¶óÁú¼ö ÀÖ´Ù. À§ÀÇ Æ®¸®´Â ÅؽºÆ® ³ëµå¸¦ ¾î¶»°Ô ó¸®ÇÏ´À³Ä¿¡ µû¶ó ´ÙÁßÀÇ ³ëµå·Î ³ª´µ¾îÁú¼öµµ ÀÖ´Ù. The Node class ±âº»ÀûÀÎ ³ëµå Ŭ·¡½º¸¦ »ìÆ캸±â·Î ÇÏÀÚ. ¸ðµç Document, Element, Text µîÀÇ ±âŸ DOM ³ëµåµéÀº ³ëµåÀÇ ¼­ºê Ŭ·¡½ºÀÌ´Ù. ´ÜÁö ³ëµå°¡ Á¦°øÇÏ´Â ÀÎÅÍÆäÀ̽º¸¦ »ç¿ëÇÏ¿© ¸¹Àº ÀÛ¾÷À» Çϴ°ÍÀÌ °¡´ÉÇÏ´Ù. XXX table of attributes and methods readonly attribute DOMString nodeName; attribute DOMString nodeValue; // raises(DOMException) on setting // raises(DOMException) on retrieval readonly attribute unsigned short nodeType; readonly attribute Node parentNode; readonly attribute NodeList childNodes; readonly attribute Node firstChild; readonly attribute Node lastChild; readonly attribute Node previousSibling; readonly attribute Node nextSibling; readonly attribute NamedNodeMap attributes; readonly attribute Document ownerDocument; Node insertBefore(in Node newChild, in Node refChild) raises(DOMException); Node replaceChild(in Node newChild, in Node oldChild) raises(DOMException); Node removeChild(in Node oldChild) raises(DOMException); Node appendChild(in Node newChild) raises(DOMException); boolean hasChildNodes(); Node cloneNode(in boolean deep); Document, Element, and Text nodes Àüü Æ®¸®ÀÇ ±âº»Àº µµÅ¥¸ÕÆ® ³ëµåÀ̸ç, µµÅ¥¸ÕÆ® ³ëµåÀÇ documentElement ¼Ó¼ºÀº ·çÆ® ¿ä¼Ò¿¡ ´ëÇÑ ¿ä¼Ò³ëµå(element node) ¸¦ Æ÷ÇÔÇÑ´Ù. µµÅ¥¸ÕÆ® ³ëµå´Â ProcessingInstruction ³ëµå¿Í °°Àº Ãß°¡ÀûÀÎ ÀÚ½ÄÀ» °¡Áú ¼ö ÀÖ´Ù. the complete list of children XXX. Walking Over The Entire Tree xml.dom.package ´Â Æ®¸®¸¦ Ž»ö(walk)ÇÏ´Â µîÀÇ ÀÛ¾÷¿¡ ´Ù¾çÇÑ µµ¿òÀ» Áִ Ŭ·¡½º¸¦ Æ÷ÇÔÇÏ°í ÀÖ´Ù. The Walker class Introduction to the walker class Building A Document Intro to builder Processing HTML Intro to HTML builder °ü·Ã ȨÆäÀÌÁö http://www.w3.org/DOM/ ¿ùµå ¿ÍÀ̵å À¥ ÄÁ¼Ò½Ã¿òÀÇ DOM ÆäÀÌÁö http://www.w3.org/TR/1998/REC-DOM-Level-1-19981001/ DOM Level 1 ±Ç°í¾È. ´ëºÎºÐÀÇ Ç¥ÁØ°ú ´Þ¸®, ÀÌ°ÍÀº ÄÚ¾î XML ÀÎÅÍÆäÀ̽º¿¡¸¸ °ü½ÉÀÌ ÀÖ´õ¶óµµ ÀÐÀ»¼öÀÖ°Ô µÇ¾îÀÖ´Ù. ¿ë¾îÇؼ³ XML Àº ¸¹Àº ¿ë¾îµéÀ» °¡Áö°í ÀÖ´Ù. À̹øÀå¿¡¼­´Â ±×Áß¿¡¼­ Áß¿äÇÑ ¿ë¾î¿Í ±×¿¡ °ü·ÃµÈ ³»¿ëÀ» ¼³¸íÇϵµ·Ï ÇÑ´Ù. ¿©±â¿¡ ³ª¿Â Á¤ÀǵéÀº Lars Marius Garshol ÀÇ SGML ¿ë¾îÇؼ³ (http://www.stud.ifi.uio.no/&#126;larsga/download/diverse/sgmlglos.html) ¿¡¼­ Âü°íÇÏ¿´´Ù. DOM (Document Object Model) ¹®¼­ ¿ÀºêÁ§Æ® ¸ðµ¨Àº Ç÷§Æû °ú ¾ð¾î¿¡ Á߸³ÀûÀÎ ÀÎÅÍÆäÀ̽º·Î¼­, ÇÁ·Î±×·¥°ú ½ºÅ©¸³Æ®°¡ µ¿ÀûÀ¸·Î ¹®¼­ÀÇ ³»¿ë°ú ±¸Á¶, ½ºÅ¸ÀÏ¿¡ Á¢±ÙÇÏ°í °»½ÅÇÒ¼ö ÀÖµµ·Ï ÇØÁØ´Ù. ¹®¼­´Â Ⱦ´ÜÇÏ°í ¼öÁ¤ÇÒ¼öÀÖ´Â Æ®¸®±¸Á¶·Î ÀçÇ¥ÇöµÉ ¼ö ÀÖ´Ù. DTD (Document Type Definition) ¹®¼­ ÇüÀ» Á¤ÀÇÇÏ´Â DTD ´Â XML ¹®¼­Çü°ú, ¿ÏÀüÇÑ ¿ä¼ÒÀÇ Å¸ÀÔ, ¿£Æ¼Æ¼ ±×¸®°í XML ¼±¾ðÀ» Á¤ÀÇÇÑ´Ù. ´Ù¸£°Ô Ç¥ÇöÇÑ´Ù¸é, DTD ´Â XML ¹®¼­°°Àº ƯÁ¤ÇÑ Á¾·ùÀÇ ¹®¼­¸¦ ¿Ïº®ÇÏ°Ô ¹¦»çÇÑ´Ù. SAX (Simple API for XML) SAX ´Â xml-dev ¸ÞÀϸµ¸®½ºÆ®ÀÇ ¸¹Àº ±â°íÀÚ¿¡ ÀÇÇØ °³¹ßµÈ XML Æļ­¸¦ À§ÇÑ °£´ÜÇÑ Ç¥ÁØ API ÀÌ´Ù. ÀÎÅÍÆäÀ̽º´Â °´Ã¼ÁöÇâ ¾ð¾îÀÎ °æ¿ì¿¡ ÇÑÇØ, ¾ð¾î-µ¶¸³ÀûÀÌ´Ù. ÃÖÃÊ¿¡´Â Java ·Î ±¸ÇöµÇ¾úÁö¸¸, ÇöÀç·Î¼­´Â Python ÀÇ »ç¿ëµµ °¡´ÉÇÏ´Ù. SAX ´Â ¸¹Àº XML Æļ­°¡ Áö¿øÇÑ´Ù. XML (eXtensible Markup Language) XML Àº °³¹ßÁßÀÎ linking °ú stylesheets ¿¡ ´ëÇÑ ÀڽŸ¸ÀÇ Ç¥ÁØÀ» °®À¸¸ç, web ¿¡¼­ »ç¿ë°¡´ÉÇÑ SGML ¾îÇø®ÄÉÀ̼ÇÀÇ Æ¯Á¤ Ãø¸éÀÌ´Ù. XSL (eXtensible Style Language) XSL Àº XML ÀÇ ½ºÅ¸ÀϽÃÆ® ¾ð¾î·Î¼­ÀÇ Á¦¾ÈÀÌ´Ù. ÀÌ°ÍÀº XML ¹®¼­¸¦ ¸Å·ÂÀûÀÎ ¹æ¹ýÀ¸·Î ºê¶ó¿ì¡ ÇÒ¼öÀÖ°Ô Çϸç, XML ¹®¼­¸¦ HTML ·Î º¯È¯ÇÏ´Â ¹æ¹ýÀ» Á¦°øÇÑ´Ù.