source: TI07-MOLES/trunk/DIF/XQuery/DIF2MOLES.xquery @ 1822

Subversion URL: http://proj.badc.rl.ac.uk/svn/ndg/TI07-MOLES/trunk/DIF/XQuery/DIF2MOLES.xquery@1822
Revision 1822, 8.7 KB checked in by ko23, 13 years ago (diff)

Location ingest added

Line 
1(: Version for one DIF per dgMetadata instance :)
2(: Note algoritm for creating non-pre-existing organisations :)
3 (: dgPersons are not created as one can't tell automatically which are people and which are orgs, and orgs are simpler :) 
4
5declare default element namespace 'http://ndg.nerc.ac.uk/moles';
6declare namespace dif='http://gcmd.gsfc.nasa.gov/Aboutus/xml/dif/';
7declare namespace xsi='http://www.w3.org/2001/XMLSchema-instance';
8declare namespace f='http://ndg.nerc.ac.uk/moles/localfunctions';
9declare variable $input_collection as xs:string {'TargetCollection'};
10declare variable $unknown_vocab_id as xs:string {'http://vocab.ndg.nerc.ac.uk/null'};
11declare variable $ndg_data_provider_vocab as xs:string {'http://vocab.ndg.nerc.ac.uk/N010'};
12declare variable $gcmd_science_valids as xs:string {'http://gcmd.gsfc.nasa.gov/Resources/valids/gcmd_parameters.html'};
13declare variable $gcmd_project_valids as xs:string {'http://gcmd.gsfc.nasa.gov/Resources/valids/projects.html'};
14declare variable $gcmd_location_valids as xs:string {'http://gcmd.gsfc.nasa.gov/Resources/valids/locations.html'};
15declare variable $gcmd_iso_topic_list as xs:string {'http://gcmd.gsfc.nasa.gov/Resources/valids/iso_topic_list.html'};
16declare variable $cf_standard_names as xs:string {'http://www.cgd.ucar.edu/cms/eaton/cf-metadata/standard_name.html'};
17declare variable $iso_topic_list as xs:string {'http://www.isotc211.org/2005/resources/Codelist/gmxCodelists.xml#MD_TopicCategoryCode'};
18declare variable $input_repository as xs:string {'Input_Repository_Code'};
19declare variable $input_repository_local as xs:string {'Input_Repository_LocalID'};
20declare variable $input_entry_id as xs:string {'Input_Entry_ID'};
21
22for $DIF in collection($input_collection)/dif:DIF[dif:Entry_ID=$input_entry_id]
23return
24element dgMetadata {
25        element dgMetadataRecord {
26                element dgMetadataID {
27                        element schemeIdentifier {'NDG-B0'},
28                        element repositoryIdentifier {$input_repository},
29                        element localIdentifier {string($DIF/dif:Entry_ID)}
30                },
31                element dgMetadataDescription {
32                        element metadataDescriptionID {
33                                element schemeIdentifier {'NDG-B0'},
34                                element repositoryIdentifier {$input_repository},
35                                element localIdentifier {concat('generated_desc-', string($DIF/dif:Entry_ID))}
36                        },
37                        element metadataDescriptionLastUpdated {current-date()}                 ,
38                        element abstract {
39                                element abstractText {string($DIF/dif:Summary)}
40                        }
41                },
42                element name {string($DIF/dif:Entry_Title)},
43                element abbreviation {string($DIF/dif:Entry_Title)},
44                element dgDataEntity {
45                        element dgDataSetType {''},
46                        element dgDataSummary {
47                                element dgParameterSummary {
48                                        element dgParameterValue {
49                                                element dgValueDataParameter {
50                                                        element Value {''},
51                                                        element dgStandardUnit {
52                                                                element dgValidTerm {'dummy'},
53                                                                element dgValidTermID {
54                                                                        element ParentListID {$unknown_vocab_id},
55                                                                        element TermID {escape-uri('dummy unit', true())}
56                                                                }
57                                                        }
58                                                }
59                                        },
60                                        element dgStdParameterMeasured {
61                                                element dgValidTerm {'dummy'},
62                                                element dgValidTermID {
63                                                        element ParentListID {$gcmd_science_valids},
64                                                        element TermID {escape-uri('dummy term', true())}
65                                                }
66                                        },
67                                        element ParameterName {'dummy term'},
68                                        element ParameterAbbreviation {'dummy term'}
69                                },
70                                if (exists($DIF/dif:Spatial_Coverage) or exists($DIF/dif:Location) or exists($DIF/dif:Temporal_Coverage)) then
71                                        element dgDataCoverage {
72                                                if (exists($DIF/dif:Spatial_Coverage/dif:Northernmost_Latitude) or exists($DIF/(dif:Location)))  then
73                                                        element dgSpatialCoverage {
74                                                                for $boundingbox in $DIF/dif:Spatial_Coverage[exists(dif:Northernmost_Latitude)]
75                                                                return
76                                                                        element BoundingBox {
77                                                                                element LimitNorth {string($boundingbox/dif:Northernmost_Latitude)},
78                                                                                element LimitSouth {string($boundingbox/dif:Southernmost_Latitude)},
79                                                                                element LimitWest {string($boundingbox/dif:Westernmost_Longitude)},
80                                                                                element LimitEast {string($boundingbox/dif:Easternmost_Longitude)}
81                                                                        },
82                                                                for $location in $DIF/dif:Location
83                                                                return
84                                                                        element dgArea {
85                                                                                element dgValidTerm {string($location)},
86                                                                                element dgValidTermID {
87                                                                                        element ParentListID {$gcmd_location_valids},
88                                                                                        element TermID {escape-uri($location, true())}
89                                                                                }
90                                                                        }
91                                                        }
92                                                else (),
93                                                if (exists($DIF/dif:Temporal_Coverage/dif:Start_Date)) then
94                                                        element dgTemporalCoverage {
95                                                                for $temporalcoverage in $DIF/dif:Temporal_Coverage[exists(dif:Start_Date) and exists(dif:Stop_Date)]
96                                                                return
97                                                                        element DateRange {
98                                                                                element DateRangeStart {string($temporalcoverage/dif:Start_Date)},
99                                                                                element DateRangeEnd {string($temporalcoverage/dif:Stop_Date)}
100                                                                        }
101                                                        }
102                                                else ()
103                                        }
104                                else ()
105                        },
106                        element dgDataRoles {
107                                if (exists($DIF/(dif:Data_Set_Citation/dif:Dataset_Creator | dif:Originating_Center))) then
108                                        element dgDataCreator {
109                                                element dgMetadataID {
110                                                        element schemeIdentifier {'NDG-B0'},
111                                                        element repositoryIdentifier {$input_repository},
112                                                        element localIdentifier {concat('generated_creator-', string($DIF/dif:Entry_ID))}
113                                                },
114                                                element roleName {'Data Creator'},
115                                                element abbreviation {'Creator'},
116                                                for $creatorID in $DIF/(dif:Data_Set_Citation/dif:Dataset_Creator | dif:Originating_Center)
117                                                return
118                                                element dgRoleHolder {
119                                                        element dgOrganisationID {
120                                                                element schemeIdentifier {'NDG-B0'},
121                                                                element repositoryIdentifier {$input_repository},
122                                                                element localIdentifier  {escape-uri(concat('generated_orgcit-', string($creatorID)), true())}
123                                                        },
124                                                element startDate {current-date()}
125                                                }
126                                        }
127                                else (),
128                                element dgDataCurator {
129                                        element dgMetadataID {
130                                                element schemeIdentifier {'NDG-B0'},
131                                                element repositoryIdentifier {$input_repository},
132                                                element localIdentifier {concat('generated_curator-', string($DIF/dif:Entry_ID))}
133                                        },
134                                        element roleName {'Data Curator'},
135                                        element abbreviation {'Curator'},
136                                        element dgRoleHolder {
137                                                element dgOrganisationID {
138                                                        element schemeIdentifier {'NDG-B0'},
139                                                        element repositoryIdentifier {$input_repository},
140                                                        element localIdentifier {$input_repository_local}
141                                                },
142                                        element startDate {current-date()}
143                                        }
144                                }
145                        }
146                },
147                element dgStructuredKeyword {
148                        element dgValidTerm {'MDIP'},
149                        element dgValidTermID {
150                                element ParentListID {$ndg_data_provider_vocab},
151                                element TermID {'NDGO0001'}
152                        }
153                },
154                for $structuredKeywords in $DIF/dif:Keywords
155                return
156                        element dgStructuredKeyword {
157                                element dgValidTerm {$structuredKeywords},
158                                element dgValidTermID {
159                                        element ParentListID {$unknown_vocab_id},
160                                        element TermID {escape-uri($structuredKeywords, true())}
161                                }
162                        },
163                for $structuredKeywords in $DIF/dif:ISO_Topic_Category
164                return
165                        element dgStructuredKeyword {
166                                element dgValidTerm {string($structuredKeywords)},
167                                element dgValidTermID {
168                                        element ParentListID {$gcmd_iso_topic_list},
169                                        element TermID {escape-uri($structuredKeywords, true())}
170                                }
171                        },
172                if (exists($DIF/dif:DIF_Creation_Date) or exists($DIF/dif:Last_DIF_Revision_Date)) then
173                        element dgMetadataProvenance {
174                                if (exists($DIF/dif:DIF_Creation_Date)) then
175                                        element RecordCreation {
176                                                element CreatedDate {
177                                                        if (string($DIF/dif:DIF_Creation_Date) castable as xs:date) then
178                                                                string($DIF/dif:DIF_Creation_Date) cast as xs:date
179                                                        else (current-date())
180                                                },
181                                        element CreatedBy {$input_repository}
182                                        }
183                                else
184                                        element RecordCreation {
185                                                element CreatedDate {current-date()},
186                                                element CreatedBy {'MOLES Import'}
187                                        },
188                                if (exists($DIF/dif:Last_DIF_Revision_Date)) then
189                                        element RecordUpdate {
190                                                element UpdateDate {
191                                                        if (string($DIF/dif:Last_DIF_Revision_Date) castable as xs:date) then
192                                                                string($DIF/dif:Last_DIF_Revision_Date) cast as xs:date
193                                                        else (current-date())
194                                                },
195                                                element UpdatedBy {$input_repository}
196                                        }
197                                else ()
198                        }
199                else ()
200        } (: </dgMetadataRecord>:),
201        for $creator in distinct-values($DIF/(dif:Data_Set_Citation/dif:Dataset_Creator | dif:Originating_Center))
202        return
203                element dgOrganisation {
204                        element dgMetadataID {
205                                element schemeIdentifier {'NDG-B0'},
206                                element repositoryIdentifier {$input_repository},
207                                element localIdentifier {escape-uri(concat('generated_orgcit-', string($creator)), true())}
208                        },
209                        element name {string($creator)},
210                        element abbreviation {string($creator)},
211                        element contactDetails {''}
212                }
213} (:    </dgMetadata> :)
Note: See TracBrowser for help on using the repository browser.