Digitaaltehnika: Informatsiooni kodeerimisega seotud mõisteid - Definition of Terms: Codes and Digital Information Encoding

Mõiste / Term
 

Selgitus / Definition
 

algoritm (algorithm)

Algoritm on toimingute järjend, mis on vajalik konkreetse probleemi lahendamiseks.

 

algoritmi plokkskeem (flowchart)

Algoritmi plokkskeem on joonis, millega kirjeldatakse arvutiprogrammis teostatavate tegevuste ja protsesside järjestust ning teostamise tingimusi.

 

allakadu (underflow)

Allakadu (varem ka "alatäitumine") on info kadumine arvväärtuse vähenemisel teatud väärtusest allapoole. Allakao tulemusel võib väärtus hüpata näiteks maksimaalsele võimalikule.

 

Ameerika infovahetuse standardkood (American Standard Code for Information Interchange, ASCII)

 

Kodeering ASCII (lühend sõnadest „American Standard Code for Information Interchange“) kirjeldab arve, tähemärke, eriotstarbelisi sümboleid ja juhtkoode 7-bitise kahendkoodiga.

 

andmeedastuskiirus boodides (baudrate)

Bood (baud) on sümbolikiiruse või modulatsioonikiiruse ühik (sümbolites või pulssides sekundi kohta liinikoodis).

 

andmesõna (data word)

Andmesõna on andmekogum, mis moodustab terviku ja mida töödeldakse korraga. Arvutite ja programmeeritavate kontrollerite puhul on andmesõna enamasti pikkusega 8..64 bitti.

 

aritmeetikatehe (arithmetic operation)

Aritmeetikatehe on arvudega teostatav liitmis-, lahutamis-, korrutamis- või jagamistehe.

 

arvu märk (sign)

Märk on nullist erineva arvu omadus. Reaalarvude digitaalsel säilitamisel salvestatakse märgiinfo sageli eraldi kahendkoodi kohas.

 

arvu murdosa (fractional part)

Reaalarvu murdosaks nimetatakse arvu ja selle täisosa (arvu täisosa) vahet.

 

arvu täisosa (integer part)

Arvu täisosa (integer, ka truncation, mis tähendab kärpimist) on väärtus, mis saadakse arvu ümardamisel nulli suunas.

 

arvusüsteem (number system, numeral system)

Arvusüsteem on arvude tähistamise ja esitamise süsteem. Arvusüsteemi oluliseks omaduseks on arvusüsteemi alus ehk raadiks (radix).

 

arvusüsteemi alus (base of the numeral system) ehk raadiks (radix)

Arvusüsteemi alus ehk raadiks on põhiarv positsioonilises arvusüsteemis või positsioonilises koodis. Hariliku kümnendsüsteemi alus on 10, kahendsüsteemi alus on 2, kuueteistkümnendsüsteemi alus on 16, kaheksandsüsteemi alus on 8 jne. Igapäevaselt on kasutusel ka kuuekümnendsüsteem (nt minutid, sekundid).

 

arvutisõna (computer word), masinasõna (machine word)

Arvutisõna ehk masinasõna on terviküksusena käsitletav koodisõna (ehk kood mis võib koosneda osadest), mis sobib töötluseks konkreetse arvuti või digitaalseadmega.

 

baidijärjestus (byte order, endianness)

Baidijärjestus on baitide järjestus mitmest baidist koosnevas masinasõnas. Sõltuvalt sellest kas lõpus (suuremal aadressil) paikneb suurema kaaluga bait (high byte) või väiksema kaaluga bait (low byte), eristatakse BE (big endian ehk jämedaotsaline baidijärjestus) ja LE (little endian ehk peeneotsaline baidijärjestus) baidijärjestusi.

 

Neljabaidise täisarvu näide

Võtame näiteks neljabaidise täisarvu kuueteistkümnendsüsteemis 0x55443322, mis kümnendsüsteemis on 1430532898.

Vähima kaaluga bait on kuueteistkümnendarvu viimane numbripaar ehk 0x22 ja suurima kaaluga bait on kuueteistkümnendarvu esimene numbripaar ehk 0x55.

Paigutades selle (neljabaidise) täisarvu mäluaadressile 10 on sõltuvalt seadmest võimalik kaks erinevat baidijärjestust:

Neljanaidine täisarv kuueteistkümnendsüsteemis: 0x55443322

Mäluaadress     Baitide väärtused jämedaotsalises järjestuses (Big-Endian value)   Baitide väärtused peeneotsalises järjestuses (Little-Endian value)

13           22           55

12           33           44

11           44           33

10           55           22

 

Tehes mäluseadme sisust väljatrüki arvutikuvari ekraanile (mälutõmmis) näeme selle sisu baitidena järjestatult vasakult paremale mäluaadresside suurenemise järjekorras.

Kui mäluseadmes on arv 0x55443322 salvestatud aadressist 10 jämedaotsalises järjestuses, siis mälutõmmis võib välja näha järgnev.

   ADDRESS: -------------------------------------------------------------------

        000010: 55 44 33 22 00 00 00 00 00 00 00 00 00 00 00 00 ...

Peeneotsalise baidijärjestuse korral vastavalt:

   ADDRESS: -------------------------------------------------------------------

        000010: 22 33 44 55 00 00 00 00 00 00 00 00 00 00 00 00 ...

 

bait (byte)

Kaheksat bitti sisaldav informatsiooniühik.

 

bitikiirus (bitrate)

Bitikiirus on edastatavate või töödeldavate bittide arv ajaühikus.

 

bitimask (bit mask)

Bitimask on kahendkoodis muster, mida rakendatakse mingile väärtusele, kasutades bitikaupa loogikatehteid (ning, või).

Bitimaski abil saab kahendkoodis väärtusest filtreerida teatud bitte.

Samuti saab bitimaski kasutada mitmesugusteks operatsioonideks kahendkoodis väärtustega. Bittide seadmine võrdseks 1-ga toimub või-tehtega, bittide nullimine toimub ning-tehtega ja bittide ümberlülitamine (inverteerimine, toggle) toimub välistava-või tehtega (XOR)

 

bititriaad, triaad (triad, triade)

Bititriaad on kolmest bitist koosnev komplekt. Kolme biti komplektid on olulised arvude esitusel kaheksandsüsteemis, sel juhul vastab igale kolmebitisele komplektile üks kaheksandsüsteemi sümbol.

 

bitti sekundis (bits per second, bps)

bitikiiruse ühik

 

bood (baud)

Bood (baud) on andmeedastuskiirus 1 sümbol sekundis, nimetus pärineb prantsuse inseneri Jean-Maurice-Emile Baudot’ nimest.

 

dekodeerimine (decoding)

Rööpkoodis sisalduva informatsiooni eraldamine (tükeldamine) eraldiseisvaks kasutamiseks sobivale kujule.

Pooljuhtmäluseadmetes kasutatakse aadressidekoodreid mille abil lülitatakse vastavalt soovitud mäluaadressile sisse erinevaid mälukiipe.

Segmentindikaatorite juhtimiseks (nt elektronkellades) kasutatakse spetsiaalseid segmentindikaatoritele mõeldud numbridekoodreid.

 

denormaliseeritud ujukomaarv (denormal number, denormalized number, subnormal number)

 

Logaritmilisel skaalal ei ole võimalik nulli esitada. Seepärast esitatakse ujukomaarvu nullilähedased väärtused denormaliseerituna (püsiva koma asukohaga vormingus).

 

EBCDIC-kood (Extended BinaryCoded Decimal InterchangeCode, EBCDIC)

EBCDIC-kood on ajalooline 8-bitine kahend-kümnendkood (BCD-kood) tekstandmete esituseks firma IBM suurarvutitel. Üht baiti kasutati kas ühe tähemärgi või kahe kümnendarvu talletamiseks. EBCDIC-kooodis teksti oli perfokaartidelt hõlpsam ilma tehniliste abivahenditeta (silmaga) lugeda kui ASCII-koodis teksti. Tänapäeval on enamlevinud ASCII-kood ja IBM’i personaalarvutite ning tööjaamade opsüsteemid seda süsteemi ei kasuta.

 

fail (file)

Fail on programmiteksti, programmikoodi või andmeid sisaldav säilitusüksus (kontoriterminoloogias „toimik“), millele on omistatud nimi. Erinevat tüüpi  andmeid (tekst, pilt, heli jms.) säilitatakse erinevates failivormingutes.

 

failivorming (file format)

Failivorming on andmete struktureerimis- ja paigutusviis failis. Erinevaid failivorminguid eristatakse sageli erinevate nimelaienditega (file extention).

 

gibibait (gibibyte, GiB)

Gibibait on standardis IEC 80000-13 määratud digitaalinformatsiooni ühik ehk ISQ-süsteemi (International System of Quantities) ühik. 1GiB ≈ 1,074GB. ISQ-süsteemiga määratud binaar-eesliited erinevad tavalises SI-süsteemis (International System of Units) määratud eesliidetest (kilo, mega, giga, tera jne.)

 

Gray kood (Gray code)

Gray kood on peegeldunud kahendkood, mis kuulub tsükkelkoodide hulka.

Frank Gray (firmast Bell Labs) tutvustas mõistet "peegeldatud kahendkood" oma patenditaotluses aastal 1947.

 

IP-protokolli versioon 6 (IPv6)

IPv6 omadused:

1) 16-baidised aadressid (praeguste 4-baidiste aadresside asemel)

2) krüpteerimine 32-bitise SAID (Security Association ID) abil koos muutuva pikkusega lähtestusvektoriga paketi päises)

3) autentimine 32-bitise SAID abil koos muutuva pikkusega autentimisandmetega paketi päises

4) konfigureerimine (sarnane DHCP-protokollile)

5) viitetundliku võrguliikluse tugi 24-bitise ID väljaga päistes hääle, video jne tähistamiseks

 

jämedaotsaline baidijärjestus (big endian, BE)

Jämedaotsalises baidijärjestuses paikneb mäluseadmete adresseerimisel suurema kaaluga bait enne väiksema kaaluga baiti. Sel viisil paikenvad baidid alates suurima kaaluga baidist kuni vähima kaaluga baidini.

 

 

Kui mäluseadmes on arv 0x55443322 salvestatud aadressist 10 jämedaotsalises järjestuses, siis mälutõmmis võib välja näha järgnev.

   ADDRESS: -------------------------------------------------------------------

        000010: 55 44 33 22 00 00 00 00 00 00 00 00 00 00 00 00 ...

 

kaheksandkood, kaheksandsüsteemis esitatud arv (octal code)

Arv, mille alus on 8 ja milles arvu iga koha jaoks on kasutusel numbrid 0..7. Kaheksandarvu iga koha säilitamiseks on vajalik vähemalt 3 bitti (bititriaad). Seitsmest suurema numbri korral toimub ülekanne arvu suurema kaaluga kohta.

 

kahend-kümnendkood (binary-coded decimal, BCD)

Kahend-kümnendkood on kahendkoodi kodeeritud kümnendarvu numbrite jada. Kahend-kümnendkood on kümnendarvude kahendkoodis esitamise meetod, mille korral iga kümnendarvu number kodeeritakse eraldi neljabitiseks kahendkoodiks.

https://et.wikipedia.org/wiki/Kahend-kümnendkood

 

kahendarv (binary number)

Kahendarv on positsiooniline kahendkood, mille iga koha kaal erineb kõrvalasuva koha kaalust kaks korda.

 

kahendkood, binaarkood (binary code)

Kood, milles informatsioon on esitatud kahendsüsteemis. Iga kahendkoodi koht on kirjeldatav Boole'i algebra muutujaga.

 

kibibait (kibibyte, KiB)

Kibibait on standardis IEC 80000-13 määratud digitaalinformatsiooni ühik ehk ISQ-süsteemi (International System of Quantities) ühik. 1KiB =1024 baiti. ISQ-süsteemiga määratud binaar-eesliited erinevad tavalises SI-süsteemis (International System of Units) määratud eesliidetest (kilo, mega, giga, tera jne.).

 

kodeerimine (encode)

Kodeerimine on andmete teisendamine mingi koodi abil.

 

kodeerimissüsteem (encoding system), kodeering (coding scheme)

Reeglite kogum, mis kujutab ühe hulga elemendid teise hulga elementideks.

Teksti säilitamiseks digitaalkujul kasutatakse selleks sobivaid kodeerimissüsteeme (nt ASCII, UNICODE jt.)

 

komakoht (radix point)

Inglise keeles tähistatakse arvu murdosa eraldajat (radix point) punktiga.

 

kood (code)

Kood on informatsiooni formuleerimiseks kasutatav tähis või esitusviis, mille abil toimub andmete edastamine ja salvestamine (näiteks sümbolite jada, triipude jada vms.). Koodide teisendamine ei pruugi olla võimalik mõlemas suunas, näiteks masinakoodis programmist pole võimalik saada esialgse programmi lähtekoodi.

 

koodilehekülg (code page)

Märgistiku märkide kodeerimissüsteemile vastav koodikomplekt.

 

kümnendsüsteem (decimal system, decimal number system)

Kümnendsüsteem on positsiooniline arvusüsteem, mille alus on kümme.

 

kuueteistkümnendsüsteem (hexadecimal number system, hexadecimal system, sedecimal notation)

 

Kuueteistkümnend-süsteem on arvusüsteem, milles arvu aluseks on 16. Kuueteistkümnendarvu iga koha jaoks on lisaks numbritele 0..9 kasutusel tähed A..F.

https://en.wikipedia.org/wiki/Hexadecimal

 

kvadratuur-pöördkooder (quadrature encoder)

Kvadratuur-pöördkooder on tsüklilist koodi väljastav pöördkooder ehk koodväljundiga digitaalne pöördliikumise asendiandur.

 

lahutusvõime, eraldusvõime (resolution)

Mõõtepunktide arv mõõdetava suuruse ühiku või ajaühiku kohta. Analoog-digitaalmuunduri eraldusvõime määrab analoog- ja digitaalsignaali seose. 12-bitine eraldusvõime tähendab analoogsignaali jagamist 212 ehk 4096 osaks. Eraldusvõimet ajaühiku kohta saab suurendada mõõtesageduse suurendamisega.

 

laiendatud topelt-täpsusega ujukomaarv (extended double precision floating-point number)

 

Laiendatud täpsusega ujukomaarv on tavapärasest suurema kahendkohtade arvuga ehk täpsem ujukomaarv. Näiteks x86 protsessorites kasutatakse 80-bitist ujukomavormingut, mis on täpsem kui standardne 64-bitine ehk topelt-täpsusega ujukomavorming.

 

MAC-aadress, meediumipöörduse juhtimise aadress (media access control address, MAC-address, physical address)

 

MAC-aadress on unikaalne riistvara aadress, näiteks Ethernet võrgus Etherneti aadress, mis on igal füüsilisel seadmel erinev.

 

mälutõmmis (memory dump)

Mälutõmmis (memory dump) on mäluseadme sisu kuva või väljatrükk (enamasti kuueteistkümnendsüsteemis). Väljatrükk tehakse üldjuhul kuueteistkümnendsüsteemis (sellest ka inglisekeelne alternatiivne nimetus "hex dump").

Failitõmmise saab näiteks Windows Powershell käsuviibalt käsuga Format-Hex failinimi.

Faili väljatrüki näide kuueteistkümnendsüsteemis (mäluseadme sisu väljatrükk on sarnase ülesehitusega).

           Path: C:\Users\ABC\Documents\image5.emf

 

           00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F

 

00000000   01 00 00 00 6C 00 00 00 CC FF FF FF E6 FF FF FF  ....l...I...æ...

00000010   04 0F 00 00 E8 04 00 00 00 00 00 00 00 00 00 00  ....c...........

00000020   BC 3E 00 00 C6 14 00 00 20 45 4D 46 00 00 01 00  ¼>..Æ... EMF....

00000030   F8 2E 01 00 AE 07 00 00 0B 00 00 00 00 00 00 00  ø...®...........

00000040   00 00 00 00 00 00 00 00 7A 1A 00 00 E2 1F 00 00  ........z...?...

00000050   1F 01 00 00 5A 01 00 00 00 00 00 00 00 00 00 00  ....Z...........

00000060   00 00 00 00 D7 60 04 00 B4 45 05 00 46 00 00 00  ....×`..?E..F...

00000070   2C 00 00 00 20 00 00 00 45 4D 46 2B 01 40 01 00  ,... ...EMF+.@..

 

 

mantiss (mantissa)

Mantiss on ujukomaesituses numeraal, mis esitatava reaalarvu leidmiseks korrutatakse astendatud ilmutamata ujukomabaasiga.

 

märgistik (character set)

Märgistik on mingiks otstarbeks kasutatav märkide komplekt. Märgistiku kasutamisel on kasutusel vastava märgistiku kodeerimissüsteem ehk tärgikodeering.

 

peeneotsaline baidijärjestus (little endian, LE)

Peeneotsalises baidijärjestuses paikneb mäluseadmete adresseerimisel väiksema kaaluga bait enne suurema kaaluga baiti. Sel viisil paikenvad baidid alates vähima kaaluga baidist kuni suurima kaaluga baidini.

 

Kui mäluseadmes on arv 0x55443322 salvestatud aadressist 10 peeneotsalises järjestuses, siis mälutõmmis võib välja näha järgnev.

   ADDRESS: -------------------------------------------------------------------

        000010: 22 33 44 55 00 00 00 00 00 00 00 00 00 00 00 00 ...

 

poolbait (nibble)

Neljast bitist koosnev andmeüksus (tetraad, bititeraad), mis moodustab baidist poole.

 

pöördkood (inverse code), ühe-täiendkood (1s complement code)

Pöördkood ehk ühe-täiendkood on kood mis saadakse kahendkohtade loogilise eitusega (negatsiooniga).

 

positsiooniline arvusüsteem (positional notation)

Positsioonilises arvusüsteemis arvud esitatakse järjestikuliste numbritena, millel on erinev kohakaal sõltuvalt selle asukohast arvu kirjeldavas numbrijärjendis. Mittepositsioonilise arvusüsteemi näiteks on Rooma numbrid.

 

püsikomaarv (fixed-point number)

Reaalarvu esitamiseks sobilik andmetüüp või esitusviis, millel on ettemääratud kohtade arv enne ja pärast komakohta.

 

rahvusvaheline elektrotehnikakomisjon (International Electrotechnical Commission, IEC)

Elektrotehnikaalase standardimisega tegelev rahvusvaheline organisatsioon.

sõna (word)

Sõna on peamine tekstielement (tähemärkide jada).

Digitaaltehnikas mõistetakse sõna all enamasti mitme numbrikohaga kahendkoodis sõna - andmesõna või masinasõna.

 

sümbol (symbol)

Sümboliks võib nimetada ükskõik millist tervikuna edastatavat andmeüksust. Sellest tulenevalt võib kahendkoodi puhul vaadelda sümbolit kui suvalist bittide komplekti. Lihtsamal juhul kirjeldab sümbol ka korraga töödeldavat teabehulka ehk andmesõna.

 

sümbolikiirus (symbol rate)

Edastatavate andmesõnade hulka sekundis kirjeldab sümbolikiirus (symbol rate, baudrate), mille ühik on bood (baud). Mitmebitiste sümbolite korral on sama edastuskiiruse juures bitikiiruse arvväärtus suurem kui sümbolikiiruse arvväärtus.

 

suurima kaaluga bait (high byte)

Mitmest baidist koosneva andmeüksuse kõige suurema kaaluga bait.

 

suurima kaaluga bitt (most significant bit, MSB)

Suurima kaaluga bitt on numbrikoht (bitikoht), millel on suurim kasutatav kaal.

 

8421-kahendkoodis (positsioonikoodis) andmesõna ühes otsas paikneb suurima kaaluga bitt ja teises otsas vähima kaaluga bitt.

 

Positsioonilises süsteemis kahendkoodis on vaja eristada suurima ja vähima kohakaaluga kahendkohta või määrata kas edastatakse koodi alates suurimast (MSB first) või vähimast kahendkohast (LSB first).

 

suurima kaaluga numbrikoht (most significant digit, MSD)

Suurima kaaluga numbrikoht positsioonikoodis on kõige vasakpoolsem nullist erinev numbrikoht.

 

tärgijada (string)

Tärgijada (märgijada) salvestatakse mäluseadmes tärgikoodide jadana (mingi tärgikodeeringu abil).

 

tärgikodeering (character encoding)

Tärgikodeering on kodeerimissüsteem mida kasutatakse tärkide sidumiseks kahendkoodidega. Lihtsamate koodide korral on sõltuvalt kasutatavast märgistikust kasutusel erinev koodilehekülg (code page).

 

tärgikood (character code)

Tärgikood on märgistiku kood (vt kodeerimissüsteem, koodilehekülg), nt. mingi tähestiku märk või sümbol, mis on kujutatud näiteks 7-bitiseks kahendsüsteemis koodiks.

 

tärk (character)

Tärk on infoühik arvutisides ja arvutustehnikas, mis kirjeldab tähtnumbrilist jms sümbolilaadset grafeemilist informatsiooni. Tärk on iseseisvat graafilist kujutist omav märk sh täht, number, kirjavahemärk, tehtemärk või muu abimärk.

 

topelt-täpsusega ujukomaarv (double-precision floating-point number)

Topelt-täpsusega ujukomaarv on 8-baidist (ehk 64-bitist) koosnev andmeüksus reaalarvude salvestamiseks ujukomavormingus. Ujukomaarvud on enamasti standardiga IEEE 754 määratud vormingus. IEEE 754 64-bitine ujukomavorming koosneb ühest märgibitist, 11-bitisest astendajast ja 53-bitisest mantissist (mantissa, significand), millest on koodis salvestatud 52-bitti.

https://en.wikipedia.org/wiki/Double-precision_floating-point_format

 

tsükkelkood (cyclic code)

Tsükkelkood on lineaarne andmevahetuskood, mille muster kordub mõlemas muutumissuunas tsükliliselt. Tsükkelkoodi väljastavad mitmesugused pöördliikumisega koodväljundiga asendiandurid - pöördkoodrid.

 

ujukomaarv (floating point number)

Ujukomaarv on andmetüüp arvu esitamiseks logaritmilisel skaalal ja sobib seetõttu nii väga väikeste ja väga suurte arvude salvestamiseks ning töötlemiseks. Ujukomaarv on paigutatav arvuti mällu kolme komponendi, märgi, arvu tüve ehk mantissi ja astendaja ehk eksponendiga.

 

ujukomaarvu normaliseerimine (normalization of floating point value)

Liikuva komaga arvu viimine kujule, milles arvu mantiss m rahuldab tingimust k-1≤|m|<1, kus k on positsioonilise arvusüsteemi alus.

 

ujukomabaas (floating-point base, floating-point radix)

Ujukomabaas on püsiv (konstantne) positiivne täisarvuline ühest suurem järgualus, mis võetakse astmesse ja korrutatakse seejärel mantissiga.

 

üle-127 noteering (excess-127 notation)

Märgiga arvu esitus ühebaidises sõnas, mille korral väärtus 127 tähistab nulli.

 

ülekadu, ületäide, ületäitumine (integer overflow, counter overrun)

Ülekadu on olukord (aritmeetikatehete, loendurite jms puhul) kui arvväärtus muutub riistvara poolt võimaldatavast suuremaks (väärtus väljub esituspiiridest), mistõttu seda käsitletakse tegelikust väiksema väärtusena.

 

Unicode-kodeering (Unicode)

Unicode on rahvusvaheline tärgikodeeringu (vt tärk) standard, mis võimaldab esitada tekste enamikes maailma kirjasüsteemides.

 

vähima kaaluga bitt (least significant bit, LSB)

Vähima kaaluga bitt on numbrikoht (bitikoht), millel on vähim kasutatav kaal. 8421-kahendkoodis (positsioonikoodis) andmesõna ühes otsas paikneb suurima kaaluga bitt ja teises otsas vähima kaaluga bitt. Positsioonilises süsteemis kahendkoodis on vaja eristada suurima ja vähima kohakaaluga kahendkohta või määrata kas edastatakse koodi alates suurimast (MSB first) või vähimast kahendkohast (LSB first).

 

vähima kaaluga numbrikoht (least significant digit, LSD)

Vähima kaaluga numbrikoht on positsioonikoodis enamasti kõige parempoolsem numbrikoht.

 

 

 

Viited

Sissejuhatus digitaaltehnikasse / Madis Lehtla, Tallinna Tehnikaülikooli elektrotehnika instituut, 2016, Tallinna Tehnikaülikooli Kirjastuse trükikoda, Harjumaa, 251 lk, ISBN 978-9949-83-021-3, lk 53-74

(C) Madis Lehtla, Sissejuhatus digitaaltehnikasse, 2016