mpasjedi/1.0.0/cycling_2_statistics_database_8py_source.html

 #!/usr/bin/env python3

 import binning_utils as bu

 from collections.abc import Iterable

 from collections import defaultdict

 from copy import deepcopy

 import datetime as dt

 import glob

 import logging

 import multiprocessing as mp

 import numpy as np

 import pandas as pd

 import plot_utils as pu

 import re

 import os

 import stat_utils as su

 from typing import List

 import var_utils as vu


 class DiagSpaceDict():

     def __init__(self, nrows):

         self.nrowsnrows = nrows

         self.valuesvalues = {}

         self.valuesvalues['expName'] = np.empty(nrows, np.chararray)

         self.valuesvalues['fcTDelta'] = np.empty(nrows, dt.timedelta)

         self.valuesvalues['cyDTime'] = np.empty(nrows, dt.datetime)

         for attribName in su.fileStatAttributes:

             self.valuesvalues[attribName] = np.empty(nrows, np.chararray)

         for statName in su.allFileStats:

             self.valuesvalues[statName] = np.empty(nrows, np.float)


     @classmethod

     def read(cls, cyStatsFile, expName, fcTDelta, cyDTime):

         statsDict = su.read_stats_nc(cyStatsFile)

         nrows = len(statsDict[su.fileStatAttributes[0]])

         statsDict['expName'] = np.full(nrows, expName)

         statsDict['fcTDelta'] = np.full(nrows, fcTDelta)

         statsDict['cyDTime'] = np.full(nrows, cyDTime)


         new = cls(nrows)

         for key, val in statsDict.items():

             assert key in new.values, "ERROR: DiagSpaceDict.read() "+key+" not in values"

             new.values[key][:] = val[:]

         return new


     @classmethod

     def concatasync(cls, asyncresults):

         nrows = 0

         for asyncresult in asyncresults:

             nrows += asyncresult.get().nrows


         new = cls(nrows)

         srow = 0

         for asyncresult in asyncresults:

             new.insert(asyncresult.get(), srow)

             srow += asyncresult.get().nrows

         return new


     def insert(self, other, srow):

         assert srow >= 0, ("Error: can only insert DiagSpaceDict rows >= 0, not ", srow)

         erow = srow + other.nrows - 1

         assert erow < self.nrowsnrows, ("Error: can only insert DiagSpaceDict rows < ", self.nrowsnrows, ", not ", erow)

         for key, val in other.values.items():

             if isinstance(val, Iterable):

                 assert key in self.valuesvalues, key+" not in DiagSpaceDict"

                 self.valuesvalues[key][srow:erow+1] = val[:]


     def destroy(self):

         del self.valuesvalues


 def dfIndexLevels(df, index):

     mi = df.index.names

     return pu.uniqueMembers(

                df.index.get_level_values(

                    mi.index(index) ).tolist() )


 def dfVarVals(df, loc, var):

     return pu.uniqueMembers(df.loc[loc, var].tolist())


 class StatsDB:

     '''A container class for a pandas DataFrame of

        statistics from multiple cycle and/or forecast times.

     '''

     def __init__(self, conf):

 #        self.conf = conf

     ## Examples of directory structures from which this container can extract statistics.

     ## The stats*.nc files are produced by writediagstats_obsspace.py during cycling experiments.

     # ASCII statistics file examples for cycling runs (on cheyenne):

     # (hasFCLenDir == True or self.fcTDeltas[-1] > self.fcTDeltas[0]):

     #statFile = '/glade/scratch/user/pandac/FC/3dvar/2018041500/{fcDirFormats}/diagnostic_stats/stats_omb_amsua_n19.nc'

     #            |                         |        |          |              |                |     |   |         |

     #                       ^                   ^      ^         ^              ^                 ^    ^        ^

     #                expDirectory       expLongName cyDTime  fcTDelta statsFileSubDir statsFilePrefix DAMethod DiagSpaceName


     # (hasFCLenDir == False and self.fcTDeltas[-1] == self.fcTDeltas[0]):

     #statFile = '/glade/scratch/user/pandac/DA/3dvar/2018041500/diagnostic_stats/stats_3dvar_bumpcov_amsua_n19.nc'

     #            |                         |        |          |                |     |             |         |

     #                       ^                   ^        ^       ^                 ^              ^        ^

     #                  expDirectory       expLongName  cyDTime statsFileSubDir statsFilePrefix  DAMethod  DiagSpaceName

         self.availableavailable = False


         # selected DiagSpace (ObsSpace name or ModelSpace name)

         self.DiagSpaceNameDiagSpaceName = conf['DiagSpaceName']

         self.loggerlogger = logging.getLogger(__name__+'.'+self.DiagSpaceNameDiagSpaceName)


         # cycle DateTimes

         firstCycleDTime = conf['firstCycleDTime']

         lastCycleDTime = conf['lastCycleDTime']

         cyTimeInc = conf['cyTimeInc']

         assert cyTimeInc > dt.timedelta(0), "cyTimeInc must be > 0"


         # forecast TimeDeltas

         fcTDeltaFirst = conf['fcTDeltaFirst']

         fcTDeltaLast = conf['fcTDeltaLast']

         fcTimeInc = conf['fcTimeInc']

         assert fcTimeInc > dt.timedelta(0), "fcTimeInc must be > 0"


         # experiment info

         self.expDirectoryexpDirectory = conf['expDirectory']

         self.expLongNamesexpLongNames = conf['expLongNames']

         self.expNamesexpNames = conf['expNames']

         self.cntrlExpIndexcntrlExpIndex = conf['cntrlExpIndex']

         self.cntrlExpNamecntrlExpName = self.expNamesexpNames[min([self.cntrlExpIndexcntrlExpIndex, len(self.expNamesexpNames)-1])]

         self.noncntrlExpNamesnoncntrlExpNames = [x for x in self.expNamesexpNames if x != self.cntrlExpNamecntrlExpName]

         self.loggerlogger.info('Control Experiment: '+self.cntrlExpNamecntrlExpName)

         self.loggerlogger.info(('Non-control Experiment(s): ', self.noncntrlExpNamesnoncntrlExpNames))


         self.DAMethodsDAMethods = conf['DAMethods']


         self.diagnosticConfigsdiagnosticConfigs = conf['diagnosticConfigs']


         self.statsFileSubDirsstatsFileSubDirs = conf['statsFileSubDirs']


         fcDirFormats = conf['fcDirFormats']


         self.fcTDeltasfcTDeltas = []

         self.fcTDeltas_dirfcTDeltas_dir = defaultdict(list)

         self.fcTDeltas_totminfcTDeltas_totmin = []

         dumTimeDelta = fcTDeltaFirst

         while dumTimeDelta <= fcTDeltaLast:

             for expName, fcDirFormat in list(zip(self.expNamesexpNames, fcDirFormats)):

                 self.fcTDeltas_dirfcTDeltas_dir[expName] += [TDelta_dir(dumTimeDelta, fcDirFormat)]

             self.fcTDeltas_totminfcTDeltas_totmin.append(TDelta_dir(dumTimeDelta, "%m"))

             # self.fcTDeltas_totsec.append(TDelta_dir(dumTimeDelta, "%s"))


             self.fcTDeltasfcTDeltas.append(dumTimeDelta)

             dumTimeDelta = dumTimeDelta + fcTimeInc


         # whether directory structure includes forecast length

         self.hasFCLenDirhasFCLenDir = conf['hasFCLenDir']

         if self.fcTDeltasfcTDeltas[-1] > self.fcTDeltasfcTDeltas[0]: self.hasFCLenDirhasFCLenDir = True


         self.cyDTimes_dircyDTimes_dir = []

         self.cyDTimescyDTimes = []

         dumDateTime = firstCycleDTime

         while dumDateTime <= lastCycleDTime:

             cy_date_str = "{:04d}".format(dumDateTime.year)  \

                         + "{:02d}".format(dumDateTime.month) \

                         + "{:02d}".format(dumDateTime.day)   \

                         + "{:02d}".format(dumDateTime.hour)

             self.cyDTimes_dircyDTimes_dir.append(cy_date_str)

             self.cyDTimescyDTimes.append(dumDateTime)

             dumDateTime = dumDateTime + cyTimeInc


         # Retrieve list of DiagSpaceNames from files available for all experiments

         # TODO: Only populate DiagSpaceNames if all cyDTimes and fcTDeltas meet

         #       these conditions:

         #         (1) all stats files are present

         #         (2) all stats files contain the same number of rows (easier)

         #             or equivalent rows (harder)

         # TODO: add the capability to calculate the stats when files are missing/incomplete

         #       and then output to correct file name

         expsDiagSpaceNames = []

         for expName, expLongName, statsFileSubDir, DAMethod in list(zip(

             self.expNamesexpNames, self.expLongNamesexpLongNames, self.statsFileSubDirsstatsFileSubDirs, self.DAMethodsDAMethods)):

             dateDir = self.cyDTimes_dircyDTimes_dir[0]

             if self.hasFCLenDirhasFCLenDir:

                 dateDir = dateDir+'/'+self.fcTDeltas_dirfcTDeltas_dir[expName][0]


             FILEPREFIX0 = self.expDirectoryexpDirectory+'/'+expLongName +'/'+dateDir+'/' \

                           +statsFileSubDir+'/'+su.statsFilePrefix

             if DAMethod != '': FILEPREFIX0 += DAMethod+"_"


             DiagSpaceNames = []

             for File in glob.glob(FILEPREFIX0+'*.nc'):

                DiagSpaceName = File[len(FILEPREFIX0):-len('.nc')]

                if DiagSpaceName == self.DiagSpaceNameDiagSpaceName:

                    DiagSpaceNames.append(DiagSpaceName)

             expsDiagSpaceNames.append(DiagSpaceNames)


         # Remove DiagSpaceNames that are not common to all experiments

         self.availDiagSpaceNamesavailDiagSpaceNames = deepcopy(expsDiagSpaceNames[0])

         if len(expsDiagSpaceNames) > 1:

             for expDiagSpaceNames in expsDiagSpaceNames[1:]:

                 for DiagSpaceName in expDiagSpaceNames:

                     if DiagSpaceName not in expDiagSpaceNames:

                         self.availDiagSpaceNamesavailDiagSpaceNames.remove(DiagSpaceName)


         if (len(self.availDiagSpaceNamesavailDiagSpaceNames) < 1):

             self.loggerlogger.warning("stats files not available for creating a StatsDB"+

                                 "object for the selected DiagSpace => "+self.DiagSpaceNameDiagSpaceName)

             return


         assert len(self.availDiagSpaceNamesavailDiagSpaceNames) == 1, (

             "\n\nERROR: only one DiagSpaceName per object is allowed.")


         self.availableavailable = True


     def read(self, np=1):

         if not self.availableavailable: return


         self.loggerlogger.info("=====================================================")

         self.loggerlogger.info("Construct pandas dataframe from static database files")

         self.loggerlogger.info("=====================================================")


         nprocs = min(mp.cpu_count(), np)


         # Read stats for this DiagSpaceName

         self.loggerlogger.info("Reading intermediate statistics files")

         self.loggerlogger.info("with "+str(nprocs)+" out of "+str(mp.cpu_count())+" processors")

         workers = mp.Pool(nprocs)

         dsDictParts = []

         for cyDTime, cyDTime_dir in list(zip(self.cyDTimescyDTimes, self.cyDTimes_dircyDTimes_dir)):

             self.loggerlogger.info("  Working on cycle time "+str(cyDTime))

             missingFiles = []


             for expName, expLongName, statsFileSubDir, DAMethod in list(zip(

                 self.expNamesexpNames, self.expLongNamesexpLongNames, self.statsFileSubDirsstatsFileSubDirs, self.DAMethodsDAMethods)):

                 expPrefix = self.expDirectoryexpDirectory+'/'+expLongName

                 ncStatsFile = statsFileSubDir+'/'+su.statsFilePrefix

                 if DAMethod != '': ncStatsFile += DAMethod+"_"

                 ncStatsFile += self.DiagSpaceNameDiagSpaceName+'.nc'

                 for fcTDelta, fcTDelta_dir in list(zip(

                     self.fcTDeltasfcTDeltas, self.fcTDeltas_dirfcTDeltas_dir[expName])):


                     #Read all stats/attributes from NC file for ExpName, fcTDelta, cyDTime

                     dateDir = cyDTime_dir

                     if self.hasFCLenDirhasFCLenDir:

                         dateDir = dateDir+'/'+fcTDelta_dir

                     cyStatsFile = expPrefix+'/'+dateDir+'/'+ncStatsFile


                     if os.path.exists(cyStatsFile):

                         dsDictParts.append(workers.apply_async(DiagSpaceDict.read,

                             args = (cyStatsFile, expName, fcTDelta, cyDTime)))

                     else:

                         missingFiles.append(cyStatsFile)


             if len(missingFiles) > 0:

                 self.loggerlogger.warning("The following files do not exist.  Matching times are excluded from the statistsics.")

                 for File in missingFiles:

                     self.loggerlogger.warning(File)

         workers.close()

         workers.join()


         self.loggerlogger.info("Concatenating statistics sub-dictionaries from multiple processors")

         dsDict = DiagSpaceDict.concatasync(dsDictParts)


         ## Convert dsDict to DataFrame

         self.loggerlogger.info("Constructing a dataframe from statistics dictionary")

         dsDF = pd.DataFrame.from_dict(dsDict.values)

         dsDict.destroy()

         del dsDictParts


         self.loggerlogger.info("Sorting the dataframe index")


         indexNames = ['expName', 'fcTDelta', 'cyDTime', 'DiagSpaceGrp',

                       'varName', 'diagName', 'binVar', 'binVal', 'binMethod']


         dsDF.set_index(indexNames, inplace=True)

         dsDF.sort_index(inplace=True)


         self.loggerlogger.info("Extracting index values")

         ##  diagspace group

         self.DiagSpaceGrpDiagSpaceGrp = dsDF.index.levels[indexNames.index('DiagSpaceGrp')]


         # remove the DiagSpaceGrp dimension, because it's common across all rows

         #       expName      fcTDelta    cyDTime                     varName     diagName    binVar      binVal      binMethod

         dsLoc = (slice(None), slice(None), slice(None), self.DiagSpaceGrpDiagSpaceGrp[0], slice(None), slice(None), slice(None), slice(None), slice(None))

         self.dfwdfw = DFWrapper(dsDF.xs(dsLoc))


         self.initAttributesinitAttributesinitAttributes()


         # add non-aggregated derived diagnostics as needed

         createORreplaceDerivedDiagnostics(self.dfwdfw, self.diagnosticConfigsdiagnosticConfigs)


     def initAttributes(self):

         ## diagnostics (currently unused)

         #self.containedDiagNames = self.dfw.levels('diagName')


         ##  variables

         # get varNames and sort alphabetically

         varNames = self.dfwdfw.levels('varName')

         nVars = len(varNames)

         indices = list(range(nVars))


         # sort by channel number (int) for radiances

         chlist = ['']*nVars

         for ivar, varName in enumerate(varNames):

             for c in list(range(len(varName))):

                 sub = varName[c:]

                 if pu.isint(sub):

                     chlist[ivar] = int(sub)

                     break

         if '' in chlist:

             indices.sort(key=varNames.__getitem__)

         else:

             indices.sort(key=chlist.__getitem__)

         self.varNamesvarNames = list(map(varNames.__getitem__, indices))

         self.chlistchlist = list(map(chlist.__getitem__, indices))


         ## extract units for each varName from varUnits DF column

         self.varUnitssvarUnitss = []

         varLoc = {}

         varLoc['fcTDelta'] = self.fcTDeltasfcTDeltas[0]

         varLoc['cyDTime'] = self.cyDTimescyDTimes[0]

         allDiags = self.dfwdfw.levels('diagName', varLoc)

         varLoc['diagName'] = allDiags[0]


         for varName in self.varNamesvarNames:

             varLoc['varName'] = varName

             units = self.dfwdfw.uniquevals('varUnits', varLoc)

             assert len(units) == 1, ("\n\nERROR: too many units values for varName = "+varName,

                                     units, varLoc)

             self.varUnitssvarUnitss.append(units[0])


         ##  bin values --> combination of numerical and string, all stored as strings

         self.allBinValsallBinVals = self.dfwdfw.levels('binVal')


         # convert allBinVals to numeric type that can be used as axes values

         self.binNumValsbinNumVals = []

         self.binNumVals2DasStrbinNumVals2DasStr = []

         for binVal in self.allBinValsallBinVals:

             if pu.isint(binVal):

                 self.binNumValsbinNumVals.append(int(binVal))

                 self.binNumVals2DasStrbinNumVals2DasStr.append(binVal)

             elif pu.isfloat(binVal):

                 self.binNumValsbinNumVals.append(float(binVal))

                 self.binNumVals2DasStrbinNumVals2DasStr.append(binVal)

             else:

                 self.binNumValsbinNumVals.append(vu.miss_i)


     def appendDF(self, newDiagDF):

         self.dfwdfw.append(newDiagDF)

         self.initAttributesinitAttributesinitAttributes()


     def loc(self, locDict, var=None):

         return DFWrapper(self.dfwdfw.loc(locDict, var))


     ## not used yet, but should work

     # def agg(self, aggovers=['cyDTime']):

     #     return DFWrapper(self.dfw.aggStats(groupby))


 def createORreplaceDerivedDiagnostics(dfw, diagnosticConfigs):

     for diagName, diagnosticConfig in diagnosticConfigs.items():

         if diagnosticConfig['derived']:

             diagNames = dfw.levels('diagName')

             if diagName in diagNames:

                 # drop derived diagName from dfw

                 dfw.df.drop(diagName, level='diagName', inplace=True)


             # create then append DataFrame with derived diagName

             derivedDiagDF = diagnosticConfig['DFWFunction'](

                 dfw, diagnosticConfig['staticArg'])

             dfw.append(derivedDiagDF)


 class DFWrapper:

     def __init__(self, df):

         self.dfdf = df

         self.indexNamesindexNames = list(self.dfdf.index.names)


     @classmethod

     def fromLoc(cls, other, locDict, var=None):

         return cls(other.locdf(other.locTuple(locDict), var))


     @classmethod

     def fromAggStats(cls, other, aggovers):

         return cls(other.aggStats(aggovers))


     def append(self, otherDF = None):

         if otherDF is None: return


         #Add otherDF (DataFrame object) to self.df

         # adds new column names as needed

         # adds meaningless NaN entries in columns that do not overlap between two DF's

         # TODO: reduce memory footprint of NaN's via modifications to external data flows

         appendDF = otherDF.copy(True)


         selfColumns = list(self.dfdf.columns)

         appendColumns = list(appendDF.columns)


         selfNRows = len(self.dfdf.index)

         for column in appendColumns:

             if column not in selfColumns:

                 self.dfdf.insert(len(list(self.dfdf.columns)), column, [np.NaN]*selfNRows)


         appendNRows = len(appendDF.index)

         for column in selfColumns:

             if column not in appendColumns:

                 appendDF.insert(len(list(appendDF.columns)), column, [np.NaN]*appendNRows)


         self.dfdf = self.dfdf.append(appendDF, sort=True)


     def locTuple(self, locDict={}):

         Loc = ()

         for index in list(locDict.keys()):

             assert index in self.indexNamesindexNames,(

                 "\n\nERROR: index name not in the multiindex, index = "+index

                 +", indexNames = ", self.indexNamesindexNames)


         for index in self.indexNamesindexNames:

             indL = list(Loc)

             if index not in locDict:

                 indL.append(slice(None))

             elif locDict[index] is None:

                 indL.append(slice(None))

             elif (isinstance(locDict[index], Iterable) and

                 not isinstance(locDict[index], str)):

                 indL.append(locDict[index])

             else:

                 indL.append([locDict[index]])

             Loc = tuple(indL)

         return Loc


     def locdf(self, Loc, var=None):

         if var is None:

             return self.dfdf.loc[Loc,:]

         else:

             return self.dfdf.loc[Loc, var]


     def levels(self, index, locDict={}):

         newDF = self.locdflocdflocdf(self.locTuplelocTuplelocTuple(locDict))

         return dfIndexLevels(newDF, index)


     def loc(self, locDict, var=None):

         return self.locdflocdflocdf(self.locTuplelocTuplelocTuple(locDict), var)


     def var(self, var):

         return self.loclocloc({}, var=var)


     def uniquevals(self, var, locDict={}):

         return pu.uniqueMembers(self.loclocloc(locDict, var).tolist())


     def min(self, locDict, var=None):

         return self.locdflocdflocdf(self.locTuplelocTuplelocTuple(locDict), var).dropna().min()


     def max(self, locDict, var):

         return self.locdflocdflocdf(self.locTuplelocTuplelocTuple(locDict), var).dropna().max()


     def aggStats(self, aggovers):

         groupby = deepcopy(self.indexNamesindexNames)

         for aggover in aggovers:

             assert aggover in self.indexNamesindexNames, (

                 "\n\nERROR: aggover argument not in the multiindex, aggover = "+aggover

                 +", indexNames = ", self.indexNamesindexNames)

             if aggover in groupby: groupby.remove(aggover)

         return self.dfdf.groupby(groupby).apply(su.aggStatsDF)


 def TDelta_dir(tdelta, fmt):

     subs = {}

     fmts = {}

     i = '{:d}'

     i02 = '{:02d}'


     # "%D %HH:%MM:%SS"

     subs["D"] = tdelta.days

     fmts["D"] = i


     subs["HH"], hrem = divmod(tdelta.seconds, 3600)

     fmts["HH"] = i02


     subs["MM"], subs["SS"] = divmod(hrem, 60)

     fmts["MM"] = i02

     fmts["SS"] = i02


     ts = int(tdelta.total_seconds())


     # "%h"

     subs["h"], hrem = divmod(ts, 3600)

     fmts["h"] = i


     # "%MIN:%SEC"

     subs["MIN"], subs["SEC"] = divmod(ts, 60)

     fmts["MIN"] = i

     fmts["SEC"] = i02


     subs["m"] = subs["MIN"]

     fmts["m"] = fmts["MIN"]


     # "%s"

     subs["s"] = ts

     fmts["s"] = i


     out = fmt

     for key in subs.keys():

         out = out.replace("%"+key, fmts[key].format(subs[key]))


     return out

StatisticsDatabase.DFWrapper
Definition: StatisticsDatabase.py:371

StatisticsDatabase.DFWrapper.var
def var(self, var)
Definition: StatisticsDatabase.py:442

StatisticsDatabase.DFWrapper.fromAggStats
def fromAggStats(cls, other, aggovers)
Definition: StatisticsDatabase.py:381

StatisticsDatabase.DFWrapper.levels
def levels(self, index, locDict={})
Definition: StatisticsDatabase.py:435

StatisticsDatabase.DFWrapper.append
def append(self, otherDF=None)
Definition: StatisticsDatabase.py:384

StatisticsDatabase.DFWrapper.aggStats
def aggStats(self, aggovers)
Definition: StatisticsDatabase.py:454

StatisticsDatabase.DFWrapper.loc
def loc(self, locDict, var=None)
Definition: StatisticsDatabase.py:439

StatisticsDatabase.DFWrapper.uniquevals
def uniquevals(self, var, locDict={})
Definition: StatisticsDatabase.py:445

StatisticsDatabase.DFWrapper.min
def min(self, locDict, var=None)
Definition: StatisticsDatabase.py:448

StatisticsDatabase.DFWrapper.indexNames
indexNames
Definition: StatisticsDatabase.py:374

StatisticsDatabase.DFWrapper.locdf
def locdf(self, Loc, var=None)
Definition: StatisticsDatabase.py:429

StatisticsDatabase.DFWrapper.max
def max(self, locDict, var)
Definition: StatisticsDatabase.py:451

StatisticsDatabase.DFWrapper.df
df
Definition: StatisticsDatabase.py:373

StatisticsDatabase.DFWrapper.fromLoc
def fromLoc(cls, other, locDict, var=None)
Definition: StatisticsDatabase.py:377

StatisticsDatabase.DFWrapper.locTuple
def locTuple(self, locDict={})
Definition: StatisticsDatabase.py:408

StatisticsDatabase.DFWrapper.__init__
def __init__(self, df)
Definition: StatisticsDatabase.py:372

StatisticsDatabase.DiagSpaceDict
Definition: StatisticsDatabase.py:19

StatisticsDatabase.DiagSpaceDict.__init__
def __init__(self, nrows)
Definition: StatisticsDatabase.py:20

StatisticsDatabase.DiagSpaceDict.concatasync
def concatasync(cls, asyncresults)
Definition: StatisticsDatabase.py:46

StatisticsDatabase.DiagSpaceDict.destroy
def destroy(self)
Definition: StatisticsDatabase.py:67

StatisticsDatabase.DiagSpaceDict.insert
def insert(self, other, srow)
Definition: StatisticsDatabase.py:58

StatisticsDatabase.DiagSpaceDict.nrows
nrows
Definition: StatisticsDatabase.py:21

StatisticsDatabase.DiagSpaceDict.values
values
Definition: StatisticsDatabase.py:22

StatisticsDatabase.DiagSpaceDict.read
def read(cls, cyStatsFile, expName, fcTDelta, cyDTime)
Definition: StatisticsDatabase.py:32

StatisticsDatabase.StatsDB
Definition: StatisticsDatabase.py:82

StatisticsDatabase.StatsDB.available
available
Examples of directory structures from which this container can extract statistics.
Definition: StatisticsDatabase.py:102

StatisticsDatabase.StatsDB.fcTDeltas
fcTDeltas
Definition: StatisticsDatabase.py:138

StatisticsDatabase.StatsDB.appendDF
def appendDF(self, newDiagDF)
Definition: StatisticsDatabase.py:344

StatisticsDatabase.StatsDB.cntrlExpIndex
cntrlExpIndex
Definition: StatisticsDatabase.py:124

StatisticsDatabase.StatsDB.varUnitss
varUnitss
extract units for each varName from varUnits DF column
Definition: StatisticsDatabase.py:314

StatisticsDatabase.StatsDB.binNumVals2DasStr
binNumVals2DasStr
Definition: StatisticsDatabase.py:333

StatisticsDatabase.StatsDB.loc
def loc(self, locDict, var=None)
Definition: StatisticsDatabase.py:348

StatisticsDatabase.StatsDB.hasFCLenDir
hasFCLenDir
Definition: StatisticsDatabase.py:152

StatisticsDatabase.StatsDB.__init__
def __init__(self, conf)
Definition: StatisticsDatabase.py:86

StatisticsDatabase.StatsDB.DiagSpaceName
DiagSpaceName
Definition: StatisticsDatabase.py:105

StatisticsDatabase.StatsDB.read
def read(self, np=1)
Definition: StatisticsDatabase.py:211

StatisticsDatabase.StatsDB.DiagSpaceGrp
DiagSpaceGrp
Convert dsDict to DataFrame.
Definition: StatisticsDatabase.py:276

StatisticsDatabase.StatsDB.logger
logger
Definition: StatisticsDatabase.py:106

StatisticsDatabase.StatsDB.binNumVals
binNumVals
Definition: StatisticsDatabase.py:332

StatisticsDatabase.StatsDB.cyDTimes_dir
cyDTimes_dir
Definition: StatisticsDatabase.py:155

StatisticsDatabase.StatsDB.dfw
dfw
Definition: StatisticsDatabase.py:281

StatisticsDatabase.StatsDB.expNames
expNames
Definition: StatisticsDatabase.py:123

StatisticsDatabase.StatsDB.allBinVals
allBinVals
bin values --> combination of numerical and string, all stored as strings
Definition: StatisticsDatabase.py:329

StatisticsDatabase.StatsDB.statsFileSubDirs
statsFileSubDirs
Definition: StatisticsDatabase.py:134

StatisticsDatabase.StatsDB.diagnosticConfigs
diagnosticConfigs
Definition: StatisticsDatabase.py:132

StatisticsDatabase.StatsDB.fcTDeltas_dir
fcTDeltas_dir
Definition: StatisticsDatabase.py:139

StatisticsDatabase.StatsDB.cyDTimes
cyDTimes
Definition: StatisticsDatabase.py:156

StatisticsDatabase.StatsDB.initAttributes
def initAttributes(self)
Definition: StatisticsDatabase.py:288

StatisticsDatabase.StatsDB.expDirectory
expDirectory
Definition: StatisticsDatabase.py:121

StatisticsDatabase.StatsDB.varNames
varNames
diagnostics (currently unused) self.containedDiagNames = self.dfw.levels('diagName')
Definition: StatisticsDatabase.py:310

StatisticsDatabase.StatsDB.noncntrlExpNames
noncntrlExpNames
Definition: StatisticsDatabase.py:126

StatisticsDatabase.StatsDB.cntrlExpName
cntrlExpName
Definition: StatisticsDatabase.py:125

StatisticsDatabase.StatsDB.fcTDeltas_totmin
fcTDeltas_totmin
Definition: StatisticsDatabase.py:140

StatisticsDatabase.StatsDB.DAMethods
DAMethods
Definition: StatisticsDatabase.py:130

StatisticsDatabase.StatsDB.chlist
chlist
Definition: StatisticsDatabase.py:311

StatisticsDatabase.StatsDB.availDiagSpaceNames
availDiagSpaceNames
Definition: StatisticsDatabase.py:194

StatisticsDatabase.StatsDB.expLongNames
expLongNames
Definition: StatisticsDatabase.py:122

StatisticsDatabase.dfVarVals
def dfVarVals(df, loc, var)
Definition: StatisticsDatabase.py:78

StatisticsDatabase.dfIndexLevels
def dfIndexLevels(df, index)
Definition: StatisticsDatabase.py:71

StatisticsDatabase.TDelta_dir
def TDelta_dir(tdelta, fmt)
Definition: StatisticsDatabase.py:464

StatisticsDatabase.createORreplaceDerivedDiagnostics
def createORreplaceDerivedDiagnostics(dfw, diagnosticConfigs)
Definition: StatisticsDatabase.py:357

logsetup.format
format
Definition: logsetup.py:49