source: CMIP6dreqbuild/trunk/src/framework/ingest/config_c4.py @ 713

Subversion URL: http://proj.badc.rl.ac.uk/svn/exarch/CMIP6dreqbuild/trunk/src/framework/ingest/config_c4.py@713
Revision 713, 25.7 KB checked in by mjuckes, 5 years ago (diff)

New ingestion pathway

Line 
1import string
2import utils_c4 as utils
3import os
4import os.path as op
5import shutil, collections
6from versionConfig import version, versionComment
7
8NT_project = collections.namedtuple( 'project', ['id','v'] )
9NT_fnParts = collections.namedtuple( 'fnParts', ['len','fxLen','unfLen','checkTLen','ixDomain','ixFreq'] )
10
11##############################################################################
12# Configure config-file paths
13#
14# All configuration directories, e.g. cmip5_vocabs, are looked for in a single
15# parent directory.  This is the "config" directory within the package unless
16# the environment variable CC_CONFIG_DIR is set.
17
18HERE = op.dirname(__file__)
19CC_CONFIG_DEFAULT_DIR = op.join(HERE, 'config')
20CC_CONFIG_DEFAULT_DIR = '/data/tmp/svn3/exarch/CMIP6dreqbuild/trunk/srcMisc/config/'
21CC_CONFIG_DIR = os.environ.get('CC_CONFIG_DIR', CC_CONFIG_DEFAULT_DIR)
22
23##############################################################################
24
25validCmip5Experiments = ['1pctCO2', 'abrupt4xCO2', 'amip', 'amip4K', 'amip4xCO2', 'amipFuture', 'aqua4K', 'aqua4xCO2', 'aquaControl', 'decadal1959', 'decadal1960', 'decadal1961', 'decadal1962', 'decadal1963', 'decadal1964', 'decadal1965', 'decadal1966', 'decadal1967', 'decadal1968', 'decadal1969', 'decadal1970', 'decadal1971', 'decadal1972', 'decadal1973', 'decadal1974', 'decadal1975', 'decadal1976', 'decadal1977', 'decadal1978', 'decadal1979', 'decadal1980', 'decadal1981', 'decadal1982', 'decadal1983', 'decadal1984', 'decadal1985', 'decadal1986', 'decadal1987', 'decadal1988', 'decadal1989', 'decadal1990', 'decadal1991', 'decadal1992', 'decadal1993', 'decadal1994', 'decadal1995', 'decadal1996', 'decadal1997', 'decadal1998', 'decadal1999', 'decadal2000', 'decadal2001', 'decadal2002', 'decadal2003', 'decadal2004', 'decadal2005', 'decadal2006', 'decadal2007', 'decadal2008', 'decadal2009', 'decadal2010', 'decadal2011', 'decadal2012', 'esmControl', 'esmFdbk1', 'esmFdbk2', 'esmFixClim1', 'esmFixClim2', 'esmHistorical', 'esmrcp85', 'historical', 'historicalExt', 'historicalGHG', 'historicalMisc', 'historicalNat', 'lgm', 'midHolocene', 'noVolc1960', 'noVolc1965', 'noVolc1970', 'noVolc1975', 'noVolc1980', 'noVolc1985', 'noVolc1990', 'noVolc1995', 'noVolc2000', 'noVolc2005', 'past1000', 'piControl', 'rcp26', 'rcp45', 'rcp60', 'rcp85', 'sst2020', 'sst2030', 'sst2090', 'sst2090rcp45', 'sstClim', 'sstClim4xCO2', 'sstClimAerosol', 'sstClimSulfate', 'volcIn2010']
26
27validCordexExperiment = validCmip5Experiments + ['evaluation']
28
29
30validCmip5Frequencies = ['fx','yr','monClim','mon','day','6hr','3hr','subhr']
31validCordexFrequencies = ['fx','sem','mon','day','6hr','3hr']
32validSpecsFrequencies = ['fx','mon','day','6hr']
33validCcmiFrequencies = ['fx','yr','mon','day','hr','subhr']
34validSpecsExptFamilies = map( lambda x: string.strip( x ), 
35                              open( op.join(CC_CONFIG_DIR, 'specs_vocabs/exptFamily.txt' )).readlines() )
36
37validCordexDomainsL = [ 'SAM-44', 'CAM-44', 'NAM-44', 'EUR-44', 'AFR-44', 'WAS-44', 'EAS-44', 'CAS-44', 'AUS-44', 'ANT-44', 'ARC-44', 'MED-44']
38validCordexDomainsLi = map( lambda x: x + 'i', validCordexDomainsL )
39validCordexDomainsH = ['EUR-11']
40validCordexDomains = validCordexDomainsL + validCordexDomainsLi + validCordexDomainsH
41
42plevRequired = ['clh', 'clm', 'cll', 'ua850', 'va850', 'ta850', 'hus850', 'ua500', 'va500', 'ta500', 'zg500', 'ua200', 'va200', 'ta200', 'zg200']
43plevBndsRequired = ['clh', 'clm', 'cll']
44heightRequired = ['tas','tasmax','tasmin','huss','sfcWind','sfcWindmax','wsgsmax','uas','vas']
45
46
47ii = open( op.join(CC_CONFIG_DIR, 'cordex_vocabs/GCMModelName.txt' )).readlines()
48validGcmNames = []
49for l in ii:
50  if l[0] != '#' and len( string.strip(l) ) > 0:
51    validGcmNames.append( string.split(l)[0] )
52
53ii = open( op.join(CC_CONFIG_DIR, 'cordex_vocabs/RCMModelName.txt' )).readlines()
54validRcmNames = []
55validInstNames = []
56for l in ii:
57  if l[0] != '#' and len( string.strip(l) ) > 0:
58    bits = string.split(l)
59    validRcmNames.append( bits[0] )
60    validInstNames.append( bits[1] )
61
62plevValues = {'clh':22000, 'clm':56000, 'cll':84000}
63for i in [200,500,850]:
64  for v in ['zg','ua', 'va', 'ta', 'hus']:
65    k = '%s%s' % (v,i)
66    plevValues[k] = i*100
67
68heightRequired = ['tas', 'tasmax', 'tasmin', 'huss', 'sfcWind', 'sfcWindmax', 'wsgsmax', 'uas', 'vas']
69heightValues = {}
70heightRange = {}
71for v in heightRequired:
72  if v in ['tas', 'tasmax', 'tasmin', 'huss']:
73    heightValues[v] = 2
74  else:
75    heightValues[v] = 10
76  heightRange[v] = (1.5,10.)
77
78ii = open( op.join(CC_CONFIG_DIR, 'cordex_vocabs/cordex_domains.csv' )).readlines()
79keys = ['name','tag','res','grid_np_lon','grid_np_lat','nlon','nlat','w','e','s','n']
80rotatedPoleGrids = {}
81for l in ii[2:16]:
82  bits = string.split(string.strip(l),',')
83  ee = {}
84  i = 0
85  for k in keys:
86    if k in ['nlon','nlat']:
87      ee[k] = int(bits[i])
88    elif k in ['grid_np_lon','grid_np_lat','w','e','s','n','res']:
89      if bits[i] != 'N/A':
90        ee[k] = float(bits[i])
91      else:
92        ee[k] = bits[i]
93    else:
94      ee[k] = bits[i]
95    i += 1
96    rotatedPoleGrids[bits[1]] = ee
97
98##Area,Name, deg,Nlon,Nlat,West8,East8,South8,North8,
99keys = ['name','tag','res','nlon','nlat','w','e','s','n']
100interpolatedGrids = {}
101for l in ii[18:33]:
102  bits = string.split(string.strip(l),',')
103  ee = {}
104  i = 0
105  for k in keys:
106    if k in ['nlon','nlat']:
107      ee[k] = int(bits[i])
108    elif k in ['w','e','s','n','res']:
109        ee[k] = float(bits[i])
110    else:
111      ee[k] = bits[i]
112    i += 1
113    interpolatedGrids[bits[1]] = ee
114
115class readVocab(object):
116
117  def __init__(self,dir):
118    self.dir = dir
119
120  def driver(self,tt):
121    if tt[0] == "simpleList":
122      tx = tt + (None,None,None,None)
123      return self.getSimpleList( tx[1],bit=tx[2],omt=tx[3],options=tx[4] )
124    else:
125      print 'readVocab.driver: option %s not recgnised' % tt[0]
126
127  def getEvalAssign(self, file ):
128    ii = open('%s/%s/%s' % (CC_CONFIG_DIR, self.dir,file) )
129    ll = []
130    for l in ii.readlines():
131      if l[0] != '#':
132        ll.append( l )
133    assert len(ll) == 1, 'Too many lines in %s' % file 
134    try:
135      return eval( ll[0] )
136    except:
137      print 'Failed to evaluate configuration line from %s:\n%s' % (file,l[0])
138      raise
139
140  def getSimpleList(self,file,bit=None,omt=None,options=None):
141    ii = open('%s/%s/%s' % (CC_CONFIG_DIR, self.dir,file) )
142    oo = []
143    if options == None:
144      olist = []
145    else:
146      olist = string.split(options,',')
147
148    if 'returnMappings' in olist:
149      assert bit in [0, -1], 'only support returnMappings for bit = -1 or 0'
150      ee = {}
151
152    for l in ii.readlines():
153      if l[0] != '#':
154        ll = string.strip(l)
155        if omt == 'last':
156          oo.append(string.join(string.split(ll)[:-1]))
157        elif bit == None:
158          oo.append(ll)
159        else:
160          if 'returnMappings' in olist:
161            bb = string.split(ll)
162            if bit == -1:
163              ee[bb[-1]] = string.join( bb[:-1] )
164            else:
165              ee[bb[0]] = string.join( bb[1:] )
166            oo.append( bb[bit] )
167          else:
168            oo.append(string.split(ll)[bit])
169
170    if 'noneMap' in olist:
171      oo = map( lambda x: {'None':None}.get(x,x), oo )
172
173    if 'returnMappings' in olist:
174      return oo, ee
175    else:
176      return oo
177
178validSpecsInstitutions = ['IC3', 'MPI-M', 'KNMI', 'UOXF', 'CNRM-CERFACS', 'ENEA', 'MOHC', 'SMHI', 'IPSL', 'UREAD', 'ECWMF']
179
180class projectConfig(object):
181
182  def __init__(self, project, version=-1):
183    knownProjects = ['CMIP5','CCMI','CORDEX','SPECS','ESA-CCI', '__dummy']
184    assert project in knownProjects, 'Project %s not in knownProjects %s' % (project, str(knownProjects))
185
186    self.project = project
187    self.fNameSep = '_'
188    self.varIndex = 0
189    self.fnvdict = None
190    self.varTables='CMIP'
191    self.checkVarType = True
192    self.projectV = NT_project(project,version)
193    self.gridSpecTol = 0.01
194## default encoding of time range in file names: YYYY[MM[DD[HH]]]-YYYY[MM[DD[HH]]]
195    self.trangeType = 'CMIP'
196    self.controlledFnParts = []
197    if project == 'CORDEX':
198      self.requiredGlobalAttributes = [ 'institute_id', 'contact', 'rcm_version_id', 'product', 'CORDEX_domain', 'creation_date', \
199             'frequency', 'model_id', 'driving_model_id', 'driving_experiment', 'driving_model_ensemble_member', 'experiment_id']
200      self.controlledGlobalAttributes = ['frequency', 'driving_experiment_name', 'project_id', 'CORDEX_domain', 'driving_model_id', 'model_id', 'institute_id','driving_model_ensemble_member','rcm_version_id']
201      self.globalAttributesInFn = [None,'CORDEX_domain','driving_model_id','experiment_id','driving_model_ensemble_member','model_id','rcm_version_id']
202      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
203      self.drsMappings = {'variable':'@var','institute':'institute_id', 'product':'product', 'experiment':'experiment_id', \
204                        'ensemble':'driving_model_ensemble_member', 'model':'model_id', 'driving_model':'driving_model_id', \
205                        'frequency':'frequency', \
206                        'project':'project_id', 'domain':'CORDEX_domain', 'model_version':'rcm_version_id' }
207
208    elif project == 'SPECS':
209      lrdr = readVocab( 'specs_vocabs/')
210      self.requiredGlobalAttributes = lrdr.driver( ('simpleList', 'globalAts.txt' ) )
211      self.exptFamilies = lrdr.driver( ('simpleList', 'exptFamily.txt', 0 ) )
212      self.validInstitutions = lrdr.driver( ('simpleList', 'validInstitutions_sv0101.txt' ) )
213      self.realm = lrdr.driver( ('simpleList', 'realm_sv0101.txt' ) )
214      self.controlledGlobalAttributes = lrdr.driver( ('simpleList', 'controlledGlobalAttributes_sv0101.txt' ) )
215                       ##'initialization_method','physics_version','realization']
216      self.globalAttributesInFn = lrdr.driver( ('simpleList', 'globalAttributesInFn_sv0101.txt',None,None,'noneMap' ) )
217      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
218      oo, self.drsMappings = lrdr.driver( ('simpleList', 'drsMappings_sv0101.txt',0,None,'returnMappings' ) )
219
220      ##self.drsMappings = {'variable':'@var', 'institute':'institute_id', 'product':'product', 'experiment':'experiment_id', \
221                        ##'ensemble':'@ensemble', 'model':'model_id', 'realm':'modeling_realm', \
222                        ##'frequency':'frequency', 'start_date':'@forecast_reference_time', \
223                        ##'table':'@mip_id',
224                        ##'project':'project_id'}
225
226    elif project == 'CMIP5':
227      lrdr = readVocab( 'cmip5_vocabs/')
228      self.requiredGlobalAttributes = [ 'contact', 'product', 'creation_date', 'tracking_id', \
229              'experiment_id']
230      ##self.requiredGlobalAttributes = lrdr.getSimpleList( 'globalAts.txt' )
231      self.controlledGlobalAttributes = [ 'project_id','experiment_id', 'frequency','Conventions','modeling_realm', \
232                       'initialization_method','physics_version','realization']
233      self.globalAttributesInFn = [None,'@mip_id','model_id','experiment_id','@ensemble']
234#sic_Oimon_EC-Earth2_seaIceBestInit_S19910501_series1_r1i1p1_199501-199502.nc
235## mip_id derived from global attribute Table_id (CMOR convention); experiment family derived from experiment_id, ensemble derived from rip attributes.
236      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
237## key: DRS element name, value: global attribute name or tag for mapping from file information ("@....").
238      self.drsMappings = {'variable':'@var', 'institute':'institute_id', 'product':'product', 'experiment':'experiment_id', \
239                        'ensemble':'@ensemble', 'model':'model_id', 'realm':'modeling_realm', \
240                        'frequency':'frequency',  'table':'@mip_id',
241                        'project':'project_id'}
242
243    elif project == 'CCMI':
244      lrdr = readVocab( 'ccmi_vocabs/')
245      self.requiredGlobalAttributes = [ 'creation_date', 'tracking_id', 'forcing', 'model_id', 'parent_experiment_id', 'parent_experiment_rip', 'branch_time', 'contact', 'institute_id' ]
246      self.requiredGlobalAttributes = lrdr.getSimpleList( 'globalAts.txt', bit=0 )
247      self.controlledGlobalAttributes = [ 'experiment_id', 'project', 'frequency' ]
248      self.globalAttributesInFn = [None,'@mip_id','model_id','experiment_id','@ensemble']
249      self.requiredVarAttributes = ['long_name', 'units']
250      self.drsMappings = {'variable':'@var', 'institute':'institute_id', 'product':'product', 'experiment':'experiment_id', \
251                        'ensemble':'@ensemble', 'model':'model_id', 'realm':'modeling_realm', \
252                        'frequency':'frequency',  'table':'@mip_id',
253                        'project':'project_id'}
254
255    elif project == 'ESA-CCI':
256      lrdr = readVocab( 'esacci_vocabs/')
257      self.varTables='FLAT'
258      self.fNameSep = '-'
259      self.checkVarType = False
260      self.requiredGlobalAttributes = lrdr.getSimpleList( 'requiredGlobalAts.txt', bit=0 )
261      self.controlledGlobalAttributes = ['platform','sensor','project','Conventions','institution','cdm_data_type','time_coverage_duration','spatial_resolution' ]
262      self.controlledFnParts = ['level','cciProject','var','version']
263      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
264      self.drsMappings = {'variable':'#var','platform':'platform','sensor':'sensor','level':'#level', \
265                'standard_name':'*standard_name', \
266                'activity':'=CLIPC', \
267                'algorithm':'$algorithm:unset', 'frequency':'$frequency', \
268                'spatial_resolution':'spatial_resolution', 'ecv':'@ecv','version':'#version','convention_version':'#gdsv'}
269      self.globalAttributesInFn = [None,]
270    elif project == '__dummy':
271      self.requiredGlobalAttributes = map( lambda x: 'ga%s' % x, range(10) )
272      self.controlledGlobalAttributes = [ ]
273      self.globalAttributesInFn = [None,'ga2', 'ga3', 'ga4' ]
274      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
275      self.drsMappings = {'variable':'@var'}
276
277####### used in checkStandardDims
278
279    self.plevRequired = plevRequired
280    self.plevValues = plevValues
281    self.heightRequired = heightRequired
282    self.heightValues = heightValues
283    self.heightRange = heightRange
284
285####### used in checkGrids
286    self.rotatedPoleGrids = rotatedPoleGrids
287    self.interpolatedGrids = interpolatedGrids
288    self.doCheckGrids = self.projectV.id in ['CORDEX',]
289
290####### used in checkFileName (freqIndex also used in checkByVar)
291
292    if self.projectV.id == 'CORDEX':
293      self.fnParts = NT_fnParts( len=[8,9], fxLen=[8,],  unfLen=[9,], checkTLen=True, ixDomain=1, ixFreq=7 )
294    elif self.projectV.id == 'CMIP5':
295      self.fnParts = NT_fnParts( len=[5,6], fxLen=[5,],  unfLen=[6,], checkTLen=False, ixDomain=None, ixFreq=None )
296    elif self.projectV.id == 'SPECS':
297      self.fnParts = lrdr.getEvalAssign( 'fnParts_sv0101.txt' )
298    elif self.projectV.id == 'CCMI':
299      self.fnParts = NT_fnParts( len=[5,6], fxLen=[5,],  unfLen=[6,], checkTLen=False, ixDomain=None, ixFreq=None )
300    elif self.projectV.id == 'ESA-CCI':
301      self.fnParts = NT_fnParts( len=[7,8,9], fxLen=[0,],  unfLen=[7,8,9,], checkTLen=False, ixDomain=None, ixFreq=None )
302      self.trangeType = 'ESA-CCI'
303    elif self.projectV.id == '__dummy':
304      self.fnParts = NT_fnParts( len=[4,5], fxLen=[4,],  unfLen=[5,], checkTLen=False, ixDomain=None, ixFreq=1 )
305
306    self.fnPartsOkLen = self.fnParts.len
307    self.fnPartsOkFixedLen = self.fnParts.fxLen
308    self.fnPartsOkUnfixedLen = self.fnParts.unfLen
309    self.checkTrangeLen = self.fnParts.checkTLen
310    self.domainIndex = self.fnParts.ixDomain
311    self.freqIndex = self.fnParts.ixFreq
312
313
314    self.defaults = { 'variableDataType':'float' }
315######## used in mipVocabs
316    if self.projectV.id == 'CORDEX':
317       self.mipVocabDir = op.join(CC_CONFIG_DIR, 'cordex_vocabs/mip/')
318       self.mipVocabTl = ['fx','sem','mon','day','6h','3h']
319       self.mipVocabVgmap = {'6h':'6hr','3h':'3hr'}
320       self.mipVocabFnpat = 'CORDEX_%s'
321    elif self.projectV.id == 'CMIP5':
322       self.mipVocabDir = op.join(CC_CONFIG_DIR, 'cmip5_vocabs/mip/')
323       self.mipVocabTl = ['fx','Oyr','Oclim','Omon','Amon','Lmon','LImon','OImon','cfMon','aero','cfDay','day','cfOff','cfSites','6hrLev','6hrPlev','3hr','cf3hr']
324       self.mipVocabVgmap = {}
325       self.mipVocabFnpat = 'CMIP5_%s'
326       self.defaults['variableDataType'] = None 
327    elif self.projectV.id == 'SPECS':
328       self.mipVocabDir = op.join(CC_CONFIG_DIR, 'specs_vocabs/mip/')
329       self.mipVocabTl = ['fx','Omon','Amon','Lmon','OImon','day','6hr']
330       self.mipVocabVgmap = {}
331       self.mipVocabFnpat = 'SPECS_%s'
332    elif self.projectV.id == 'CCMI':
333       self.mipVocabDir = op.join(CC_CONFIG_DIR, 'ccmi_vocabs/mip/')
334       self.mipVocabTl = ['fixed','annual','monthly','daily','hourly']
335       self.mipVocabVgmap = {'fixed':'fx','annual':'yr','monthly':'mon','daily':'day','hourly':'hr'}
336       self.mipVocabFnpat = 'CCMI1_%s'
337    elif self.projectV.id == 'ESA-CCI':
338       self.mipVocabDir = op.join(CC_CONFIG_DIR, 'esacci_vocabs/')
339       self.mipVocabTl = []
340       self.mipVocabVgmap = { 'ESACCI':'ESACCI' }
341       self.mipVocabFnpat = 'variableInFile.txt'
342    else:
343       self.mipVocabDir = None
344       self.mipVocabTl = ['day', 't2']
345       self.mipVocabVgmap = {}
346       self.mipVocabFnpat = None
347    self.mipVocabPars = [self.mipVocabDir, self.mipVocabTl, self.mipVocabVgmap, self.mipVocabFnpat]
348
349######## used in checkByVar
350    if self.project == 'CORDEX':
351      self.groupIndex = 7
352    elif self.project in ['CMIP5','CCMI','SPECS','__dummy']:
353      self.groupIndex = 1
354    elif self.project in ['ESA-CCI']:
355      self.fnvdict = { 'SSTskin':{'v':'sea_surface_temperature', 'sn':'sea_surface_skin_temperature'} }
356      self.fnoptions = {'groupIndex':[1,0], 'trangeIndex':[0,-2] }
357      self.fnoptions['inFn'] = [[None,'*activity','*level','*project','*var','*product','*additional','*gdsv','*version'],
358                                ['*activity','*project','*level','*var','*additional',None,'*version']]
359      self.fnoptions['varIndex'] = [4,3]
360##Indicative Date>[<Indicative Time>]-ESACCI-<Processing Level>_<CCI Project>-<Data Type>-<Product String>[- <Additional Segregator>][-v<GDS version>]-fv<File version>.nc
361##ESACCI-<CCI Project>-<Processing Level>-<Data Type>-<Product String>[-<Additional Segregator>]-<IndicativeDate>[<Indicative Time>]-fv<File version>.nc
362
363    self.trangeIndex = -1
364
365    self.getVocabs()
366    test = False
367    if test:
368      for k in self.vocabs['variable'].varcons.keys():
369        for k2 in self.vocabs['variable'].varcons[k].keys():
370          if "height2m" in self.vocabs['variable'].varcons[k][k2].get( '_dimension',[]):
371            print 'config_c4: %s , %s: %s' % (k,k2,str(self.vocabs['variable'].varcons[k][k2]['_dimension'] ) )
372
373    ##assert self.project != 'CCMI', 'Not completely set up for CCMI yet'
374
375  def getExtraAtts(self):
376
377    eafile = self.mipVocabDir + 'extraAtts.txt'
378    self.extraAtts = {}
379    if os.path.isfile( eafile ):
380      for l in open( eafile ).readlines():
381        if l[0] != '#':
382          bits = map( string.strip, string.split(l,',') )
383          id = '%s.%s' % (bits[0],bits[1])
384          ee = {}
385          for b in bits[2:]:
386            bb = string.split(b,'=')
387            ee[bb[0]] = bb[1]
388          self.extraAtts[id] = ee
389
390  def getVocabs(self):
391  ## "Returns a dictionary of vocabulary details for the project provided."
392    if self.projectV.id == 'SPECS':
393               ##'experiment_id':utils.patternControl( 'experiment_id', "(?P<val>.*)[0-9]{4}", list=validSpecsExptFamilies ), \
394      vocabs = { 'variable':utils.mipVocab(self), \
395               'Conventions':utils.listControl( 'Conventions', ['CF-1.6'] ), \
396               'frequency':utils.listControl( 'frequency', validSpecsFrequencies ), \
397               'experiment_id':utils.listControl( 'experiment_id', validSpecsExptFamilies ), \
398               'initialization_method':utils.patternControl( 'initialization_method', "[0-9]+" ), \
399               'physics_version':utils.patternControl( 'physics_version', "[0-9]+" ), \
400               'realization':utils.patternControl( 'realization', "[0-9]+" ), \
401               'startdate':utils.patternControl( 'startdate', "S[0-9]{8}" ), \
402               ## 'associated_experiment':utils.patternControl( 'associated_experment', "(?P<val>(N/A|(decadal|seasonal): r\*i[0-9]{1,4}p[0-9]{1,4}))" ), \
403               'project_id':utils.listControl( 'project_id', ['SPECS', 'NMME-SPECS'] ), \
404               ## 'institution':utils.listControl( 'institution', validSpecsInstitutions ), \
405               'modeling_realm':utils.listControl( 'realm', self.realm, split=True ), \
406             }
407    elif self.projectV.id == 'CMIP5':
408               ##'experiment_id':utils.patternControl( 'experiment_id', "(?P<val>.*)[0-9]{4}", list=validSpecsExptFamilies ), \
409      lrdr = readVocab( 'cmip5_vocabs/')
410      vocabs = { 'variable':utils.mipVocab(self), \
411               'Conventions':utils.listControl( 'Conventions', ['CF-1.4','CF-1.5'] ), \
412               'experiment_id':utils.listControl( 'experiment_id', lrdr.getSimpleList( 'experiments.txt' ) ), \
413               'frequency':utils.listControl( 'frequency', validCmip5Frequencies ), \
414               'initialization_method':utils.patternControl( 'initialization_method', "[0-9]+" ), \
415               'physics_version':utils.patternControl( 'physics_version', "[0-9]+" ), \
416               'realization':utils.patternControl( 'realization', "[0-9]+" ), \
417               'project_id':utils.listControl( 'project_id', ['CMIP5'] ), \
418               ## 'institution':utils.listControl( 'institution', validSpecsInstitutions ), \
419               'modeling_realm':utils.listControl( 'realm', ['atmos', 'ocean', 'land', 'landIce', 'seaIce', 'aerosol', 'atmosChem', 'ocnBgchem'], split=True ), \
420             }
421    elif self.projectV.id == 'CCMI':
422   
423      lrdr = readVocab( 'ccmi_vocabs/')
424      vocabs = { 'variable':utils.mipVocab(self), \
425               'frequency':utils.listControl( 'frequency', validCcmiFrequencies ), \
426               'experiment_id':utils.listControl( 'experiment_id', lrdr.getSimpleList( 'ccmi_experiments.txt', bit=-1 ) ), \
427## do not preserve or check relation between model and institution.
428               'institution':utils.listControl( 'institution', lrdr.getSimpleList( 'models_insts.txt', bit=1 ) ), \
429               'model_id':utils.listControl( 'model_id', lrdr.getSimpleList( 'models_insts.txt', bit=0 ) ), \
430               'modeling_realm':utils.listControl( 'realm', ['atmos', 'ocean', 'land', 'landIce', 'seaIce', 'aerosol', 'atmosChem', 'ocnBgchem'] ), \
431               'project_id':utils.listControl( 'project_id', ['CCMI'] ) }
432
433    elif self.projectV.id == 'ESA-CCI':
434      lrdr = readVocab( 'esacci_vocabs/')
435      cciProjectList, self.ecvMappings = lrdr.getSimpleList( 'cciProject.txt', bit=-1, options='returnMappings' )
436      vocabs = { 'variable':utils.mipVocab(self), \
437               'version':utils.patternControl( 'version',  '^(fv[0-9]+(\.[0-9]+){0,1})$', examples=['fv1.1'] ), \
438               'level':utils.listControl( 'level', lrdr.getSimpleList( 'procLevel01.txt', bit=0 ) ), \
439               'platform':utils.listControl( 'platforms', lrdr.getSimpleList( 'platforms.txt', bit=0), enumeration=True, split=True, splitVal=',' ), \
440               'institution':utils.listControl( 'institution', lrdr.getSimpleList( 'institutions.txt', omt='last' ) ), \
441               'Conventions':utils.patternControl( 'Conventions', '^CF-1.[56789](,.*){0,1}$', examples=['CF-1.6'] ), \
442               'sensor':utils.listControl( 'sensors', lrdr.getSimpleList( 'sensors.txt', bit=0 ), enumeration=True, split=True, splitVal=',' ), \
443               'cdm_data_type':utils.listControl( 'cdm_data_type', lrdr.getSimpleList( 'threddsDataType.txt', bit=0 ) ), \
444               'time_coverage_duration':utils.patternControl( 'time_coverage_duration',  'ISO8601 duration', cls='ISO',examples=['P1Y'] ), \
445               'spatial_resolution':utils.patternControl( 'spatial_resolution',  '([0-9]+(.[0-9]+){0,1})[\s]*(km|m|degree).*', examples=['20km','1 km at nadir'] ), \
446               'project':utils.listControl( 'project', ['Climate Change Initiative - European Space Agency','CLIPC'] ), \
447               'cciProject':utils.listControl( 'cciproject', cciProjectList ), \
448               'var':utils.listControl( 'var', lrdr.getSimpleList( 'variables.txt', bit=-1 ) ) \
449             }
450    elif self.projectV.id == '__dummy':
451      vocabs = { 'variable':utils.mipVocab(self,dummy=True) }
452    else:
453      vocabs = { 'variable':utils.mipVocab(self), \
454           'driving_experiment_name':utils.listControl( 'driving_experiment_name', validCordexExperiment ), \
455           'project_id':utils.listControl( 'project_id', ['CORDEX'] ), \
456           'CORDEX_domain':utils.listControl( 'CORDEX_domain',  validCordexDomains ), \
457           'driving_model_id':utils.listControl( 'driving_model_id',  validGcmNames ), \
458           'driving_model_ensemble_member':utils.patternControl( 'driving_model_ensemble_member',  'r[0-9]+i[0-9]+p[0-9]+' ), \
459           'rcm_version_id':utils.patternControl( 'rcm_version_id',  '[a-zA-Z0-9-]+' ), \
460           'model_id':utils.listControl( 'model_id',  validRcmNames ), \
461           'institute_id':utils.listControl( 'institute_id',  validInstNames ), \
462           'frequency':utils.listControl( 'frequency', validCordexFrequencies ) }
463
464    self.vocabs = vocabs
465
466
467  def setEsaCciFNType(self,id):
468      if id in [1,2]:
469        id1 = 1
470      else:
471        id1 = id
472      self.groupIndex =  self.fnoptions['groupIndex'][id1]
473      self.trangeIndex = self.fnoptions['trangeIndex'][id1]
474      self.globalAttributesInFn = self.fnoptions['inFn'][id1]
475      self.varIndex = self.fnoptions['varIndex'][id1]
476
477
478def copy_config(dest_dir):
479   """
480   Copy the current default configuration directory into a separate directory.
481
482   The directory <ceda_cc-package-dir>/config is copied to `dest_dir`.
483   This is useful when ceda-cc is installed as a Python package and the user may
484   not know where the config directory is stored.
485
486   :param dest_dir: should be a path to a directory which does not yet exist. 
487       The configuration directory will be copied to this path.
488
489   """
490   shutil.copytree(CC_CONFIG_DEFAULT_DIR, dest_dir)
Note: See TracBrowser for help on using the repository browser.