source: CCCC/tags/0.1/config_c4.py @ 155

Subversion URL: http://proj.badc.rl.ac.uk/svn/exarch/CCCC/tags/0.1/config_c4.py@1241
Revision 155, 17.3 KB checked in by mjuckes, 6 years ago (diff)

various fixes for aMap feature -- see updates.txt

Line 
1import string
2import utils_c4 as utils
3
4validCmip5Experiments = ['1pctCO2', 'abrupt4xCO2', 'amip', 'amip4K', 'amip4xCO2', 'amipFuture', 'aqua4K', 'aqua4xCO2', 'aquaControl', 'decadal1959', 'decadal1960', 'decadal1961', 'decadal1962', 'decadal1963', 'decadal1964', 'decadal1965', 'decadal1966', 'decadal1967', 'decadal1968', 'decadal1969', 'decadal1970', 'decadal1971', 'decadal1972', 'decadal1973', 'decadal1974', 'decadal1975', 'decadal1976', 'decadal1977', 'decadal1978', 'decadal1979', 'decadal1980', 'decadal1981', 'decadal1982', 'decadal1983', 'decadal1984', 'decadal1985', 'decadal1986', 'decadal1987', 'decadal1988', 'decadal1989', 'decadal1990', 'decadal1991', 'decadal1992', 'decadal1993', 'decadal1994', 'decadal1995', 'decadal1996', 'decadal1997', 'decadal1998', 'decadal1999', 'decadal2000', 'decadal2001', 'decadal2002', 'decadal2003', 'decadal2004', 'decadal2005', 'decadal2006', 'decadal2007', 'decadal2008', 'decadal2009', 'decadal2010', 'decadal2011', 'decadal2012', 'esmControl', 'esmFdbk1', 'esmFdbk2', 'esmFixClim1', 'esmFixClim2', 'esmHistorical', 'esmrcp85', 'historical', 'historicalExt', 'historicalGHG', 'historicalMisc', 'historicalNat', 'lgm', 'midHolocene', 'noVolc1960', 'noVolc1965', 'noVolc1970', 'noVolc1975', 'noVolc1980', 'noVolc1985', 'noVolc1990', 'noVolc1995', 'noVolc2000', 'noVolc2005', 'past1000', 'piControl', 'rcp26', 'rcp45', 'rcp60', 'rcp85', 'sst2020', 'sst2030', 'sst2090', 'sst2090rcp45', 'sstClim', 'sstClim4xCO2', 'sstClimAerosol', 'sstClimSulfate', 'volcIn2010']
5
6validCordexExperiment = validCmip5Experiments + ['evaluation']
7
8
9validCmip5Frequencies = ['fx','yr','monClim','mon','day','6hr','3hr','subhr']
10validCordexFrequencies = ['fx','sem','mon','day','6hr','3hr']
11validSpecsFrequencies = ['fx','mon','day','6hr']
12validCcmiFrequencies = ['fx','yr','mon','day','hr','subhr']
13validSpecsExptFamilies = map( lambda x: string.split( x )[0], open( 'specs_vocabs/exptFamily.txt' ).readlines() )
14
15validCordexDomainsL = [ 'SAM-44', 'CAM-44', 'NAM-44', 'EUR-44', 'AFR-44', 'WAS-44', 'EAS-44', 'CAS-44', 'AUS-44', 'ANT-44', 'ARC-44', 'MED-44']
16validCordexDomainsLi = map( lambda x: x + 'i', validCordexDomainsL )
17validCordexDomainsH = ['EUR-11']
18validCordexDomains = validCordexDomainsL + validCordexDomainsLi + validCordexDomainsH
19
20plevRequired = ['clh', 'clm', 'cll', 'ua850', 'va850', 'ta850', 'hus850', 'ua500', 'va500', 'ta500', 'zg500', 'ua200', 'va200', 'ta200', 'zg200']
21plevBndsRequired = ['clh', 'clm', 'cll']
22heightRequired = ['tas','tasmax','tasmin','huss','sfcWind','sfcWindmax','wsgsmax','uas','vas']
23
24
25ii = open( 'cordex_vocabs/GCMModelName.txt' ).readlines()
26validGcmNames = []
27for l in ii:
28  if l[0] != '#' and len( string.strip(l) ) > 0:
29    validGcmNames.append( string.split(l)[0] )
30
31ii = open( 'cordex_vocabs/RCMModelName.txt' ).readlines()
32validRcmNames = []
33validInstNames = []
34for l in ii:
35  if l[0] != '#' and len( string.strip(l) ) > 0:
36    bits = string.split(l)
37    validRcmNames.append( bits[0] )
38    validInstNames.append( bits[1] )
39
40plevValues = {'clh':22000, 'clm':56000, 'cll':84000}
41for i in [200,500,850]:
42  for v in ['zg','ua', 'va', 'ta', 'hus']:
43    k = '%s%s' % (v,i)
44    plevValues[k] = i*100
45
46heightRequired = ['tas', 'tasmax', 'tasmin', 'huss', 'sfcWind', 'sfcWindmax', 'wsgsmax', 'uas', 'vas']
47heightValues = {}
48heightRange = {}
49for v in heightRequired:
50  if v in ['tas', 'tasmax', 'tasmin', 'huss']:
51    heightValues[v] = 2
52  else:
53    heightValues[v] = 10
54  heightRange[v] = (1.5,10.)
55
56ii = open( 'cordex_vocabs/cordex_domains.csv' ).readlines()
57keys = ['name','tag','res','grid_np_lon','grid_np_lat','nlon','nlat','w','e','s','n']
58rotatedPoleGrids = {}
59for l in ii[2:16]:
60  bits = string.split(string.strip(l),',')
61  ee = {}
62  i = 0
63  for k in keys:
64    if k in ['nlon','nlat']:
65      ee[k] = int(bits[i])
66    elif k in ['grid_np_lon','grid_np_lat','w','e','s','n','res']:
67      if bits[i] != 'N/A':
68        ee[k] = float(bits[i])
69      else:
70        ee[k] = bits[i]
71    else:
72      ee[k] = bits[i]
73    i += 1
74    rotatedPoleGrids[bits[1]] = ee
75
76##Area,Name, deg,Nlon,Nlat,West8,East8,South8,North8,
77keys = ['name','tag','res','nlon','nlat','w','e','s','n']
78interpolatedGrids = {}
79for l in ii[18:33]:
80  bits = string.split(string.strip(l),',')
81  ee = {}
82  i = 0
83  for k in keys:
84    if k in ['nlon','nlat']:
85      ee[k] = int(bits[i])
86    elif k in ['w','e','s','n','res']:
87        ee[k] = float(bits[i])
88    else:
89      ee[k] = bits[i]
90    i += 1
91    interpolatedGrids[bits[1]] = ee
92
93class readVocab:
94
95  def __init__(self,dir):
96    self.dir = dir
97
98  def getSimpleList(self,file,bit=None):
99    ii = open('%s/%s' % (self.dir,file) )
100    oo = []
101    for l in ii.readlines():
102      if l[0] != '#':
103        ll = string.strip(l)
104        if bit == None:
105          oo.append(ll)
106        else:
107          oo.append(string.split(ll)[bit])
108    return oo
109
110validSpecsInstitutions = ['IC3', 'MPI-M', 'KNMI', 'UOXF', 'CNRM-CERFACS', 'ENEA', 'MOHC', 'SMHI', 'IPSL', 'UREAD', 'ECWMF']
111
112def getVocabs(pcfg):
113  "Returns a dictionary of vocabulary details for the project provided."
114  if pcfg.project == 'SPECS':
115               ##'experiment_id':utils.patternControl( 'experiment_id', "(?P<val>.*)[0-9]{4}", list=validSpecsExptFamilies ), \
116    vocabs = { 'variable':utils.mipVocab(pcfg), \
117               'Conventions':utils.listControl( 'Conventions', ['CF-1.6'] ), \
118               'frequency':utils.listControl( 'frequency', validSpecsFrequencies ), \
119               'experiment_id':utils.listControl( 'experiment_id', validSpecsExptFamilies ), \
120               'initialization_method':utils.patternControl( 'initialization_method', "[0-9]+" ), \
121               'physics_version':utils.patternControl( 'physics_version', "[0-9]+" ), \
122               'realization':utils.patternControl( 'realization', "[0-9]+" ), \
123               'project_id':utils.listControl( 'project_id', ['SPECS'] ), \
124               ## 'institution':utils.listControl( 'institution', validSpecsInstitutions ), \
125               'modeling_realm':utils.listControl( 'realm', ['atmos', 'ocean', 'land', 'landIce', 'seaIce', 'aerosol', 'atmosChem', 'ocnBgchem'], split=True ), \
126               'series':utils.listControl( 'series', ['series1','series2'] ), \
127             }
128  elif pcfg.project == 'CMIP5':
129               ##'experiment_id':utils.patternControl( 'experiment_id', "(?P<val>.*)[0-9]{4}", list=validSpecsExptFamilies ), \
130    lrdr = readVocab( 'cmip5_vocabs/')
131    vocabs = { 'variable':utils.mipVocab(pcfg), \
132               'Conventions':utils.listControl( 'Conventions', ['CF-1.4','CF-1.5'] ), \
133               'experiment_id':utils.listControl( 'experiment_id', lrdr.getSimpleList( 'experiments.txt' ) ), \
134               'frequency':utils.listControl( 'frequency', validCmip5Frequencies ), \
135               'initialization_method':utils.patternControl( 'initialization_method', "[0-9]+" ), \
136               'physics_version':utils.patternControl( 'physics_version', "[0-9]+" ), \
137               'realization':utils.patternControl( 'realization', "[0-9]+" ), \
138               'project_id':utils.listControl( 'project_id', ['CMIP5'] ), \
139               ## 'institution':utils.listControl( 'institution', validSpecsInstitutions ), \
140               'modeling_realm':utils.listControl( 'realm', ['atmos', 'ocean', 'land', 'landIce', 'seaIce', 'aerosol', 'atmosChem', 'ocnBgchem'], split=True ), \
141             }
142  elif pcfg.project == 'CCMI':
143   
144    lrdr = readVocab( 'ccmi_vocabs/')
145    vocabs = { 'variable':utils.mipVocab(pcfg), \
146               'frequency':utils.listControl( 'frequency', validCcmiFrequencies ), \
147               'experiment_id':utils.listControl( 'experiment_id', lrdr.getSimpleList( 'ccmi_experiments.txt', bit=-1 ) ), \
148## do not preserve or check relation between model and institution.
149               'institution':utils.listControl( 'institution', lrdr.getSimpleList( 'models_insts.txt', bit=1 ) ), \
150               'model_id':utils.listControl( 'model_id', lrdr.getSimpleList( 'models_insts.txt', bit=0 ) ), \
151               'modeling_realm':utils.listControl( 'realm', ['atmos', 'ocean', 'land', 'landIce', 'seaIce', 'aerosol', 'atmosChem', 'ocnBgchem'] ), \
152'atmosChem' and 'ocnBgchem'
153               'project_id':utils.listControl( 'project_id', ['CCMI'] ) }
154  elif pcfg.project == '__dummy':
155    vocabs = { 'variable':utils.mipVocab(pcfg,dummy=True) }
156  else:
157    vocabs = { 'variable':utils.mipVocab(pcfg), \
158           'driving_experiment_name':utils.listControl( 'driving_experiment_name', validCordexExperiment ), \
159           'project_id':utils.listControl( 'project_id', ['CORDEX'] ), \
160           'CORDEX_domain':utils.listControl( 'CORDEX_domain',  validCordexDomains ), \
161           'driving_model_id':utils.listControl( 'driving_model_id',  validGcmNames ), \
162           'driving_model_ensemble_member':utils.patternControl( 'driving_model_ensemble_member',  'r[0-9]+i[0-9]+p[0-9]+' ), \
163           'rcm_version_id':utils.patternControl( 'rcm_version_id',  '[a-zA-Z0-9-]+' ), \
164           'model_id':utils.listControl( 'model_id',  validRcmNames ), \
165           'institute_id':utils.listControl( 'institute_id',  validInstNames ), \
166           'frequency':utils.listControl( 'frequency', validCordexFrequencies ) }
167
168  return vocabs
169
170class projectConfig:
171
172  def __init__(self, project):
173    knownProjects = ['CMIP5','CCMI','CORDEX','SPECS','__dummy']
174    assert project in knownProjects, 'Project %s not in knownProjects %s' % (project, str(knownProjects))
175
176    self.project = project
177    self.gridSpecTol = 0.01
178    if project == 'CORDEX':
179      self.requiredGlobalAttributes = [ 'institute_id', 'contact', 'rcm_version_id', 'product', 'CORDEX_domain', 'creation_date', \
180             'frequency', 'model_id', 'driving_model_id', 'driving_experiment', 'driving_model_ensemble_member', 'experiment_id']
181      self.controlledGlobalAttributes = ['frequency', 'driving_experiment_name', 'project_id', 'CORDEX_domain', 'driving_model_id', 'model_id', 'institute_id','driving_model_ensemble_member','rcm_version_id']
182      self.globalAttributesInFn = [None,'CORDEX_domain','driving_model_id','experiment_id','driving_model_ensemble_member','model_id','rcm_version_id']
183      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
184      self.drsMappings = {'variable':'@var','institute':'institute_id', 'product':'product', 'experiment':'experiment_id', \
185                        'ensemble':'driving_model_ensemble_member', 'model':'model_id', 'driving_model':'driving_model_id', \
186                        'frequency':'frequency', \
187                        'project':'project_id', 'domain':'CORDEX_domain', 'model_version':'rcm_version_id' }
188
189    elif project == 'SPECS':
190      lrdr = readVocab( 'specs_vocabs/')
191      self.requiredGlobalAttributes = [ 'contact', 'product', 'creation_date', 'tracking_id', \
192              'experiment_id', 'series']
193      self.requiredGlobalAttributes = lrdr.getSimpleList( 'globalAts.txt' )
194      self.exptFamilies = lrdr.getSimpleList( 'exptFamily.txt', bit=0 )
195      self.controlledGlobalAttributes = [ 'project_id','experiment_id', 'series','frequency','Conventions','modeling_realm', \
196                       'initialization_method','physics_version','realization']
197      self.globalAttributesInFn = [None,'@mip_id','model_id','experiment_id','series','@forecast_reference_time','@ensemble']
198#sic_Oimon_EC-Earth2_seaIceBestInit_S19910501_series1_r1i1p1_199501-199502.nc
199## mip_id derived from global attribute Table_id (CMOR convention); experiment family derived from experiment_id, ensemble derived from rip attributes.
200      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
201      self.drsMappings = {'variable':'@var', 'institute':'institution', 'product':'product', 'experiment':'experiment_id', \
202                        'ensemble':'@ensemble', 'model':'model_id', 'series':'series', 'realm':'modeling_realm', \
203                        'frequency':'frequency', 'start_date':'@forecast_reference_time', \
204                        'project':'project_id'}
205
206    elif project == 'CMIP5':
207      lrdr = readVocab( 'cmip5_vocabs/')
208      self.requiredGlobalAttributes = [ 'contact', 'product', 'creation_date', 'tracking_id', \
209              'experiment_id']
210      ##self.requiredGlobalAttributes = lrdr.getSimpleList( 'globalAts.txt' )
211      self.controlledGlobalAttributes = [ 'project_id','experiment_id', 'frequency','Conventions','modeling_realm', \
212                       'initialization_method','physics_version','realization']
213      self.globalAttributesInFn = [None,'@mip_id','model_id','experiment_id','@ensemble']
214#sic_Oimon_EC-Earth2_seaIceBestInit_S19910501_series1_r1i1p1_199501-199502.nc
215## mip_id derived from global attribute Table_id (CMOR convention); experiment family derived from experiment_id, ensemble derived from rip attributes.
216      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
217## key: DRS element name, value: global attribute name or tag for mapping from file information ("@....").
218      self.drsMappings = {'variable':'@var', 'institute':'institute_id', 'product':'product', 'experiment':'experiment_id', \
219                        'ensemble':'@ensemble', 'model':'model_id', 'realm':'modeling_realm', \
220                        'frequency':'frequency',  'table':'@mip_id',
221                        'project':'project_id'}
222
223    elif project == 'CCMI':
224      lrdr = readVocab( 'ccmi_vocabs/')
225      self.requiredGlobalAttributes = [ 'creation_date', 'tracking_id', 'forcing', 'model_id', 'parent_experiment_id', 'parent_experiment_rip', 'branch_time', 'contact', 'institute_id' ]
226      self.requiredGlobalAttributes = lrdr.getSimpleList( 'globalAts.txt' )
227      self.controlledGlobalAttributes = [ 'experiment_id', 'project', 'frequency' ]
228      self.globalAttributesInFn = [None,'@mip_id','model_id','experiment_id','@ensemble']
229      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
230      self.drsMappings = {'variable':'@var'}
231
232    elif project == '__dummy':
233      self.requiredGlobalAttributes = map( lambda x: 'ga%s' % x, range(10) )
234      self.controlledGlobalAttributes = [ ]
235      self.globalAttributesInFn = [None,'ga2', 'ga3', 'ga4' ]
236      self.requiredVarAttributes = ['long_name', 'standard_name', 'units']
237      self.drsMappings = {'variable':'@var'}
238
239####### used in checkStandardDims
240
241    self.plevRequired = plevRequired
242    self.plevValues = plevValues
243    self.heightRequired = heightRequired
244    self.heightValues = heightValues
245    self.heightRange = heightRange
246
247####### used in checkGrids
248    self.rotatedPoleGrids = rotatedPoleGrids
249    self.interpolatedGrids = interpolatedGrids
250    self.doCheckGrids = self.project in ['CORDEX',]
251
252####### used in checkFileName (freqIndex also used in checkByVar)
253
254    if self.project == 'CORDEX':
255      self.fnPartsOkLen = [8,9]
256      self.fnPartsOkFixedLen = [8,]
257      self.fnPartsOkUnfixedLen = [9,]
258      self.checkTrangeLen = True
259      self.domainIndex = 1
260      self.freqIndex = 7
261    elif self.project == 'CMIP5':
262## cRoot_Lmon_CESM1-WACCM_rcp85_r3i1p1_200601-205512.nc
263      self.fnPartsOkLen = [5,6]
264      self.fnPartsOkFixedLen = [5,]
265      self.fnPartsOkUnfixedLen = [6,]
266      self.checkTrangeLen = False
267      self.domainIndex = None
268      self.freqIndex = None
269    elif self.project == 'SPECS':
270      self.fnPartsOkLen = [7,8]
271      self.fnPartsOkFixedLen = [7,]
272      self.fnPartsOkUnfixedLen = [8,]
273      self.checkTrangeLen = False
274      self.domainIndex = None
275      self.freqIndex = 1
276    elif self.project == 'CCMI':
277      self.fnPartsOkLen = [5,6]
278      self.fnPartsOkFixedLen = [5,]
279      self.fnPartsOkUnfixedLen = [6,]
280      self.checkTrangeLen = False
281      self.domainIndex = None
282      self.freqIndex = None
283    elif self.project == '__dummy':
284      self.fnPartsOkLen = [4,5]
285      self.fnPartsOkFixedLen = [4,]
286      self.fnPartsOkUnfixedLen = [5,]
287      self.checkTrangeLen = False
288      self.domainIndex = None
289      self.freqIndex = 1
290
291
292    self.defaults = { 'variableDataType':'float' }
293######## used in mipVocabs
294    if self.project == 'CORDEX':
295       self.mipVocabDir = 'cordex_vocabs/mip/'
296       self.mipVocabTl = ['fx','sem','mon','day','6h','3h']
297       self.mipVocabVgmap = {'6h':'6hr','3h':'3hr'}
298       self.mipVocabFnpat = 'CORDEX_%s'
299    elif self.project == 'CMIP5':
300       self.mipVocabDir = 'cmip5_vocabs/mip/'
301       self.mipVocabTl = ['fx','Oyr','Oclim','Omon','Amon','Lmon','LImon','OImon','cfMon','aero','cfDay','day','cfOff','cfSites','6hrLev','6hrPlev','3hr','cf3hr']
302       self.mipVocabVgmap = {}
303       self.mipVocabFnpat = 'CMIP5_%s'
304       self.defaults['variableDataType'] = None 
305    elif self.project == 'SPECS':
306       self.mipVocabDir = 'specs_vocabs/mip/'
307       self.mipVocabTl = ['fx','Omon','Amon','Lmon','OImon','day','6hr']
308       self.mipVocabVgmap = {}
309       self.mipVocabFnpat = 'SPECS_%s'
310    elif self.project == 'CCMI':
311       self.mipVocabDir = 'ccmi_vocabs/mip/'
312       self.mipVocabTl = ['fixed','annual','monthly','daily','hourly']
313       self.mipVocabVgmap = {'fixed':'fx','annual':'yr','monthly':'mon','daily':'day','hourly':'hr'}
314       self.mipVocabFnpat = 'CCMI1_%s_comp-v5.txt'
315    else:
316       self.mipVocabDir = None
317       self.mipVocabTl = ['day', 't2']
318       self.mipVocabVgmap = {}
319       self.mipVocabFnpat = None
320    self.mipVocabPars = [self.mipVocabDir, self.mipVocabTl, self.mipVocabVgmap, self.mipVocabFnpat]
321
322######## used in checkByVar
323    if self.project == 'CORDEX':
324      self.groupIndex = 7
325    elif self.project in ['CMIP5','CCMI','SPECS','__dummy']:
326      self.groupIndex = 1
327
328    self.vocabs = getVocabs(self)
329
330    ##assert self.project != 'CCMI', 'Not completely set up for CCMI yet'
Note: See TracBrowser for help on using the repository browser.