[CCD-CR] aarchive

Jiri Polcar polcar at physics....cz
Mon Oct 14 15:50:56 CEST 2002


  Zdravim,

jelikoz se jiz delsi dobu potykame s chaosem v napozorovanych datech,
rozhodli jsem se na prirodevedecke fakulte vytvorit system, ktery by do
archivace dat zanesl poradek. Ze zkusenosti vime, ze s podobnymi
problemy se potyka vetsina lidi, chceme system vyresit co mozna
nejrobusneji, aby byl pouzitelny i jinde nez u nas.  Cely system je ve
fazi navrhu. Kazdy muze rozumnym navrhem prispet k jeho dokonalosti.
Cekame tedy komentare, doporuceni, navrhy a tak.


Po kratke diskuzi jsme dosli k nazoru, ze system musi:

            1) byt co nejjednodussi
            2) nezaviset na platforme
            3) siritelny pod GPL
            4) co mozna nejpohodlnejsi vkladani informaci
            5) automaticke zaintegrovani jiz existujicich dat
            6) umoznovat zalohovani
            7) po autentifikaci pracovat se vzdalenymi databazemi


Zde v hrubich rysech nastinim nami navrhovane reseni:

Pro reseni jsme se rozhodli vyuzit jiz existujiciho databazoveho
systemu.  Naroky na databazi, co se tyce struktury dat jsou minimalni.
Zaklad  tvori tabulka (META-DATA), ktera bude obsahovat informace o
archivovanem souboru, jako

  * datum porizeni
  * pozorovany objekt
  * souradnice snimku
  * pouzity filter
  * pozorovaci podminky
  * ...
  * ...

Dalsi tabulka bude obsahovat systemove informace:

  * datum vyvtvoreni/zmeny zaznamu
  * prava 
  * ...
  * ...

Kazdy zaznam z (META-DATA) bude obsahovat jednoznacny klic (md5sum
vkladaneho souboru) a odkaz na tabulku (META-TABLE), ve ktere jsou
uchovavany informace o datovych tabulkach (DATA), ktere budou obsahovat
vlastni data. Techto tabulek bude vic, mohou se ukladat na CD a podobne.
Informace, kde danou tabulku najit, bude uvedena v samostatne
(META-TABLE).


Zde je nakres.


                    DATABASE

 +----------------------------------------------+
 |                                              |
 |                                              |
 |                                DATA <----+   |
 |                                          |   |
 |                            +----------+  |   |
 |      META-DATA         +---+  md5sum  |  |   |
 |                        |   |          |  |   |
 |    +------------+      |   |  data    |  |   |
 |  +-+   md5sum   +------+   +----------+  |   |
 |  | |   table    +---+                    |   |
 |  | |            |   |                    |   |
 |  | |    datum   |   |                    |   |
 |  | |    objekt  |   |                    |   |
 |  | |    filter  |   |      META-TABLE    |   |
 |  | |       .    |   |                    |   |
 |  | |       .    |   |     +---------+    |   |
 |  | |       .    |   +-----+   table |    |   |
 |  | |            |         |         |    |   |
 |  | +------------+         |   link  +----+   |
 |  |                        +---------+        |
 |  |                                           |
 |  |                                           |
 |  |                                           |
 |  |                                           |
 |  |        SYSTEM-INFO                        |
 |  |                                           |
 |  |    +---------------+                      |
 |  +----+  md5sum       |                      |
 |       |               |                      |
 |       |  access rules |                      |
 |       |  changes info |                      |
 |       |      .        |                      |
 |       |      .        |                      |
 |       |      .        |                      |
 |       +---------------+                      |
 |                                              |
 +----------------------------------------------+

                    ^    |
                    |    |
                    |    |
                    |    v

                +-----------+
                |   CLIENT  |
                +-----------+



Klient bude od uzivatele prijimat dotazy, ve kterych bude specifikovano,
o jaka data ma zajem. System pozadavek vyhodnoti, a vrati uzivateli
pozadovana data. Pripadne ho vyzve, aby vlozil to ktere CD a podobne.
Podobne bude moci uzivatel dotazovat i cizi databaze (pokud mu budou
pristupny).


Aby byl sestem pouzitelny, musi jit do nej co nejjednodusej zaradit jiz
napozorovana data. A to tak, aby to bylo co nejmin pracne. K
automatickemu ziskani meta informaci lze vyuzit dvou veci

  1) jiz nejakeho existujiciho systemu ( adresarova struktura, nazvy souboru)
  2) hlavicky FITSu


Protoze kazdy ma data archyvovany jinak, bude potreba vytvorit
standartni format pro automaticky import dat. Ta by byla nezavisla na
jiz zavedenem systemu. Na uzivateli by bylo, aby systemu predal vstupni
informace ve standartnim tvaru. Napriklad:

                     <RECORD>

                     <HEAD>
                       <ATTRIBUTE>datum</ATTRIBUTE>
                       <VALUE>2002-10-14</VALUE>
                     </HEAD>

                     <HEAD>
                       <ATTRIBUTE>note</ATTRIBUTE>
                       <VALUE>Poznamka.</VALUE>
                     </HEAD>

                     <DATA path="cesta/k/soubor.fits">

                     </RECORD>



To je asi vse, k cemu jsem dosli. Zajimaji nas zkusenosti s podobnymi
vecmi, mozne nastrahy a podone.

Za tym,
JP




More information about the CCD mailing list