Juba jälle on käes kolmapäev. 
Hommikul kell 10 oli osakonnakoosolek. Ja jällegi (tundub, et kopipaste eelmisest nädalast): rääkisime plaanidest, mis tehtud/mis tegemata. 😀 Sisu muidugi oli teistsugune, aga mis ma ikka koosoleku kohta kosta oskan. Koosolek nagu koosolek ikka!
Hommikupooliku veetsin serveriruumis. Kuna Joel askeldas ettevalmistustega pärastlõunaks (ei, mitte söögipeo, vaid selleks, et saaksime toimetada edasi), siis tegelesin mina oma viie “kullakallikesega”. Pakkisin ennast soojalt sisse, sest et serveriruumis on vaid 15 kraadi sooja (+ pidev õhuvool konditsioneerist, mis teeb seal olemise veel chill‘imaks).
Sain siis kõik oma 5 serverit uuendatud viimasele BIOSi versioonile ning lisaks käisin kõik üle kõvaketta ja RAID kontrolleri püsivara uuenduse “plaadiga” (mälupulgaga). Täna veetsin siis aega 8 mälupulga seltsis. 😀
Seoses eilse tahtliku ümberkorraldusega (saime ju kommutaatori omale siia lauale) oli tänane hommik põnev. Kuna mina olin n-ö külaline, kes tahtis internetti saada, siis minule pakuti võrgust, et näe, võta endale aadress, see on vaba! Kui aga installeerisin üht serverit (varem), siis oli tema ka n-ö külaline ja anti temalegi aadress.
Täna selgus, et need aadressid olid kokku langenud. Põhjus oli lihtne – tol hetkel, kui mina oma arvuti internetti ühendasin, oli server väljas ja seetõttu oli see aadress “vaba”. Küll aga oli serverile öeldud, et kui sa korra juba sellise aadressi said, siis võta kogu aeg see sama (sest et olin ju seda aadressi kasutanud teistes masinates – olin niiöelda tutvust teinud. Lihtsamini öeldes – oli öelnud, et 192.168.1.1 on masin nimega test1). On ju test1 palju lihtsam meeles pidada kui keerulist aadressi (ja oi kui palju neid aadresse, paroole, kasutajatunnuseid ja võrgumaske kokku tegelikult on). See selleks.
Õnneks oli tegu selle sama “katkise HP serveriga” ja olime otsustanud, et teeme sellele puhastuse. OpenStackiga on selleks korraks ühel pool ja installeerisin sinnagi Debiani ja sinna peale Proxmox VE. Nüüd sain proovida üle “pika aja” jälle installeerimist. Õpetus oli muidugi kogu aeg kõrval ja ajasin näpuga kenasti järge, aga nüüd vähemalt teadsin, mida tegin (võrreldes esimese korraga).
Kolmanda masina liitmine mu pilvega tekitas nüüd palju kindlama pilve.
Tegelikult ütleb Proxmoxi kogukond ise juba, et 2 masinat – phäh, see pole midagi! peab ikka kolm olema! Õnneks lasevad nad ka kahe masinaga testida ja proovida – küll aga pole see väga kindel käik – sellesmõttes, et 3 on ju ikka parem. 
Nüüd siis koosneb mu virtuaalserverite pilv kolmest serverist.
Üks asi, mida veel pole sisse seadnud, aga mis kindlasti tuleb teha, on fencing. See on küll inglise keelne sõna, aga ma ei oskagi head vastet leida eesti keelde. Proovin seletada. Fencing on protsess, kus kõik virtuaalserverite pilves olevad sõlmed kontrollivad üksteist, kas need ikka “elus” on. “Elus” olemise all mõtlen seda, kas nende aadress vastab, kas kõik töötab nii nagu peab.
Ehk siis, kui midagi nüüd juhtub näiteks esimese masinaga sõlmes, siis teised saavad sellest aru ja ruttu-ruttu migreeruvad virtuaalserverid ümber teistele sõlmedele.
Täpsustus: ma ei tea, kas jagatakse virtuaalserverid ära, et näe, sina võta 1-5 ja mina võtan 5-10.. Või võtab esimene sõlm, kes märkab, et teine sõlm on maha kukkunud, kõik endale… Ma arvan, et saan seda varsti testides teada.
Esmaspäevases postituses rääkisin IPMIst (kasutatakse ka terminit ACPI (Advanced Configuration and Power Interface)). Tegelikult nimetab iga tootja seda veelkord omamoodi. HP kasutab terminit iLO – ehk Integrated Lights Out; Dell kasutab terminit DRAC – Dell Remote Access Card… Vaata lisaks kuutõrvajast.
Kasutan järgnevas jutus üldist terminit IPMI. Kuklas tasub sellele mõelda, et mõtlen siis seda madalamatasemelist tehnoloogiat, millega arvutisse pääseb.
Ahjaa – ma vist pole maininud – IPMI on näiteks suurepärane selle jaoks, et kaugelt serverile restarti teha, kui viimane on näiteks hangunud. Ei ole vaja 100km selleks läbi sõita, et nuppu vajutada – las elektroonika teeb oma töö!
Niisiis. Fencing kasutabki edukalt ära IPMI tehnoloogiat – registreeritud sõlmedes (nt serveripilves on 10 serverit, aga fencing seadistatud vaid 3-le) kontrollitakse üksteise olemasolu.
Meil siin töötab IPMI muust maailmast eraldatud võrgus ja sinna liigpääs on vaja spetsiaalselt konfigureerida (kas lisades võrgukaabel õigesse pessa) või ühendudes üle VPNi (Virtual Private Network – virtuaalne privaatvõrk).
Kui nüüd test-serveritest rääkida, siis see tähendaks kas:
- 1 lisa võrgukaart ja 1 võrgujuhe
- või
- VLANi seadistamine test-masinatel
Kuna produktsioonis olev virtuaalserverite pilv on ühendatud sellesse eraldatud võrku, siis piisaks antud hetkel VLANi tegemisest ja liitmisest, kuna sellisel moel hoiame raudvara kokku. Minu mäletamist mööda oleks praegu vaja kahele serverile (kolmest) lisada üks võrgukaart. See tähendaks, et kokku oleks kaableid 4 – üks välisühenduse jaoks; üks kõvaketaste jaoks; üks IPMI jaoks; ja üks eraldatud võrgu jaoks.
IPMI vajab eraldi võrguühendust ja sealt juhtme kaudu liigub ainult temaga seotud informatsioon.
Seega, see lisaks keerukust kohe hüppeliselt. Otsustasime VLANide kasuks, aga täna implementeerima ei hakka. Lisaks on tegu test-serveritega. Produktsioonis kasutaks kindlasti eraldi ühendust (st produktsioonis on ka need ühendused eraldi realiseeritud).
Jooksvalt päeval tegime ka produktsiooni-klastri ümberkorraldustöid. Joel tegi enamjaolt parandusi ja muudatusi, mis vajalik selleks, et andmed üle tõsta HP kettakasti peale. Kuna varasem süsteem oli selline, et iga virtuaalmasin käis ise kettaid küsimas, mis tekitas kogu serverile meeletult kettaid, siis uus lahendus on see, et server ise käib küsimas endale ettemääratud ketast ja jagab sealt vastavad osad LVMi kaudu õigetele virtuaalserveritele.
Lisaks – ei saa ju ühendada vaid ühe ühenduse kaudu. Kui see ühendus katkeb, mis siis saab? Andmeid pole? Kliendid istugu pimeduses? Nii ei saa ju! Seetõttu ongi meil 4-kordne ühendus, 2 ühe kommutaatori kaudu ja 2 teise, kusjuures ühte kommutaatorisse tuleb ühendus mõlemast kontrollerist. Seega, kettakasti mõttes on täielikult ühendused dubleeritud ja tõrkesiire (ingl k. failover) tagatud.
Paraku tuleb aga need neli ühendust ka serveri jaoks defineerida. Küll aga server ei mõista seda, et kõik need 4 viitavad samale kettakastile ja võtab need riburadapidi jälle järele. Paha!
Lahendus! Multipath. Multipath on tehnoloogia, mis laseb viidata ühele kettale mitme erineva aadressiga. Kettad kasutavad nn WWID või UUID numbreid. Minu arust on need kaks samatähenduslikud mõisted.
- UUID – universally unique identifier
- WWID – World Wide Identifier
Heal lapsel mitu nime!
Tegemist on siis universaalse identifikaatoriga kõvaketta jaoks. Multipath kontrollib neid ID-sid ja ühendusi. Tuleb näiteks defineerida:
UUID=11111AAA111BBB; ip=192.168.2.1
UUID=11111AAA111BBB; ip=192.168.3.1
Nüüd on meil ühe ID jaoks kaks teed. Kui kontrollimisel selgub, et üks aadress ei vasta, siis võetakse kohe kasutusele teine. Kasutajale käib see kõik märkamatult ja võib-olla (kui ta õiget hetke tabab) tema jaoks salvestub fail liiga kaua… või avaneb liiga kaua vmt.
Oeh. Täna sai küll pikk ja keeruline postitus. Ma ei tea, kas ma kõiki termineid ja tehnoloogiaid ja ideid olen täpselt seletanud, millest täna rääkisin, aga vähemalt ma ise saan aru, kui ma neid uuesti läbi lugema hakkan (aruande jaoks). Siis jõuab täpsustada. 
Aga töö käib. 
Ma saan aru, et sa ise vähemalt saad aru, millest sa kirjutad…
Minu jaoks on enamus küll hiina keeles, aga no näiteks täiesti mõistan sõnu: “osakonna koosolek”, “pilves”, “produktsioon” (see küll nö kultuurikorralduse valdkonnas), veel on tuttavad sõnad: “lahendus”, “külaline” ja “parool”.
Igatahes hoian silma sinu blogil peal ning loodan, et õpin ka midagi uut
Edu, avamstamisrõõmu ja nutikust soovides!