Ignore:
Timestamp:
06/06/06 13:24:29 (14 years ago)
Author:
lawrence
Message:

This has the code to support a temporary patch for
the unicode and orphan html characters problems. Further
details are in ticket:311

File:
1 edited

Legend:

Unmodified
Added
Removed
  • TI07-MOLES/trunk/StubB/XSLT/browse/portal/cgi/DIF.py

    r1049 r1097  
    88from ServiceBinding import Service 
    99from renderEntity import renderEntity 
     10from ETxmlView import loadET 
    1011 
    1112class DIF: 
     
    1617        '''Initialise a python dif instance based on an xml document ''' 
    1718        self.metadataType='DIF' 
    18         #self.xml=xml.decode('utf-8','replace') 
    19         #self.xml=unicode(xml,'latin-1') 
    20         #self.xml=xml.encode('latin-1','replace') 
    21         encodings=['ascii',]#['latin-1','ascii','iso-8859-1'] 
    2219        try: 
    23             for option in encodings: 
    24                 try: 
    25                     s=xml.encode(option,'replace') 
    26                      
    27                     self.elem=ET.fromstring(s) 
    28                     self.xml=s 
    29                 except UnicodeError: 
    30                     pass 
    31                 else: 
    32                     break 
     20            self.elem=loadET(xml) 
     21            self.xml=xml 
    3322        except: 
    3423            # for some reason we can't parse the document ... 
    35             #print '<p>%s</p>'%xml[11385:11395] 
    36             #raise bnl 
    37             #import codecs 
    38             #f=codecs.open('unparseable.xml','a','utf-8') 
    39             #f.write(xml+'\n') 
    40             print '<p>'+s[11360:11420]+'</p>' 
    41             raise  
     24            raise 
    4225            self.elem=None 
    4326            return 
Note: See TracChangeset for help on using the changeset viewer.