Gode råd om overførsel af personlige data / tekster / dokumenter via Internet:
af Marie Kroun, læge

Det er hurtigt og let at dele oplysninger som f.eks. undersøgelses-resultater og kopi af indscannet lægejr. via Internet, men det skal gøres med passende forsigtighed og stor omtanke!
Jeg opretter af sikkerhedsgrunde - jf. http://case.ulmarweb.dk/dir.htm - helst personlige weblmapper til deling af personlige oplysninger på egen webserver.
Jeg deler ikke / linker ikke til filer med personfølsomme oplysninger i på åbent Internet og fraråder brugere af DIR systemet at gøre det samme!

HUSK at alle åbne hjemmesider / undersider som der linkes til fra åbne websider vil nemlig på et eller andet tidspunkt få besøg af en søgemaskine f.eks. Google som følger ethvert link på undersiderne og måske tillader sig at gemme en fuldstændig kopi af alt indholdet fra hjemmesiden på søgemaskinens egen webserver eller som minimum indekserer indholdet / de hyppigst efterspurgte søgeord i deres database ....
Det er forekommet at folk har skrevet navn og CPR nummer på en hjemmeside, hvorefter Google har fanget de data og har vist det sammen i søgebilledet / teksten der kommer frem når andre søger efter person-navnet ...
Da hver søgemaskine gemmer sine egne data, kan det være svært / umuligt at finde ud af hvilke søgemaskiner der viser hvad om én selv, om de har fået fat i for personlige oplysninger og det kan være besværligt / umuligt at få slettet private data som man ved en fejl fik lagt på Internet! 

Tjek selv hvad der evt. står om DIG på Internet ved at søge på dit eget navn i Google; søger man efter Jens Hansen uden anførsels tegn omkring, kommer mange Internet sider frem der indeholder enten Jens eller Hansen eller begge dele, også selvom ordene står hver for sig; søges derimod specifikt efter "Jens Hansen" eller "Jens Christian Hansen" kommer kun de sider frem hvor den eksakte sætning indenfor anførselstegn står sammen på hjemmesiden  ...
  
Udsæt aldrig andres computere for fare for virus angreb ved at sende dem filer som vedhæftning til emails uopforderet dvs. uden efter forudgående aftale.
Når du sender vedhæftning til email beskriv da i selve teksten hvad indholdet er på en så personlig en måde, at modtager kan se det er sendt fra dig med vilje og ikke er en virus der har sneget sig til at misbruge dit system til at videresende sig selv.
Vær selv meget varsom med at åbne vedhæftninger og links som andre u-inviteret / uden forhåndsaftale sender dig og når du åbner tvivlsomme hjemmesider  ...
Vær selv meget forsigtig med at sende de mest personlige oplysninger om dig selv via email, der potentielt kan blive opsnappet af andre undervejs og som måske kan misbruges!


Gode råd om filformater til deling med andre:

Benyt til fildeling kun de gængse filformater, som alle computere kan finde gratis programmer til at læse / se dine data med!

TEKSTER der skal gengives lig printer udskrift / fotokopi, skal sendes som PDF (portable dokument format) dokumenter (se TIPS nedenfor), aldrig som et Word-dokument!
Adobe reader programmet udfører nemlig ingen eksekverbar kode, selvom der måtte være sådan kode indlejret i dokumentet, derfor er der ingen risiko for at modtagerens computer kan blive inficeret med virus blot ved at læse og vise og udskrive  dokumenter der er gemt og sendt i PDF-format, og PDF giver tilmed næsten 100% naturtro udskrift, uanset hvilken printer dokumentet udskrives på og ALT  kan udskrives til PDF "printer", både tekst og billeder, f.eks. CutePDF http://www.cutepdf.com - hvor der findes en forenklet gratis udgave, som er udmærket til alm. hjemme-computer brug ...
Opr. blev PDF formatet skabt af Adobe, som sælger professionelle værktøjer til mange penge.

Alternativt til visning på hjemmesider, kan TEKSTER gemmes i ren notesblok *.TXT - det giver ingen formatteringsmulighed, og dermed heller ingen virus overførsels mulighed, men ser kedeligt ud og kan være svært at læse.
HTML giver formatteringsmulighed, og kan indeholde program kode der udgør risiko for virus inficering af computeren der læser siden; vær opmærksom på at nogle brugere / browsere blokerer for at vise visse billed-typer / eksekverbart indhold på hjemmesider el. i HTML formatterede emails, netop fordi de udgør en vis sikkerhedsrisiko ...

Man bør altid holde sig fra at vise / sende billeder i specielle billed-formater der kræver at modtager skal have bestemte billed-læser-programmer installeret på sin computer for at kunne se indholdet.
Hold dig altid fra at anvende specielle programmer der giver mulighed for at gemme ondartet kode - virus - f.eks. i makroer, f.eks. Word tekster.

Man bør altså holde sig til de generelle billedformater som alle browsere kan "forstå" og vise, TIFF/TIF, JPG og GIF (eller evt. BMP) ... 

INDSCANNEDE FOTOs
 kan med fordel gemmes i JPG format; selvom dette format pakker filen og smider nogle billed data væk for at gøre filen mindre, så bevares farvebilleder rimelig godt med en vis skalerbarhed, men de kan tage ret lang tid at hente via en langsom Internet forbindelse.
TIFF scannede billeder gemmes derimod ukomprimerede, dvs. der sker ingen konvertering / ingen data tab, så de fylder meget og kan dermed tage lang tid at vise på en langsom computers  browser (især sløvt i gamle dage, hvor Internet overførsels hastigheden på nettet måltes i KB istedet for i MB!); en sort-hvid indcannet A4-side i TIF fylder omkring 1 Mb, mens en farvebilled fil (RGB) fylder ca. 4 gange så meget! 
Skal et indscannet billedet kunne sendes som FAX eller senere bearbejdes videre f.eks. OCR (optisk character recognition = optisk karakter genkendelse, oversættelse til computer tekst, der kan læses, kopiere og indsættes f.eks. citeres, er TIFF det eneste format man bør scanne og gemme i! - se nedenfor!)  
GIF komprimerer billed data meget mere end JPG og reducerer f.eks. mange farvet palet til nogle få farver (webpalet) for at gøre billedet meget hurtigere at læse ind i browsere via Internet.
Dette billed format er derfor velegnet til at vise især mindre billeder på hjemmesider, men billederne har mistet så meget, at det format som regel ikke tillader forstørrelse endsige pæn udprintning på en fotoprinter, dvs. billedet bliver måske meget grynet eller opdeles i firkanter i stor  forstørrelse, selvom det ser ok ud i lille størrelse på computer skærmen.
GIF filer kan endvidere indeholde flere billeder samlet i en enkelt billed fil, så browseren viser billederne efter hinanden serievis, ligesom en tegnefilm giver det indtryk af bevægelse / film, når billeder med små ændringer vises meget hurtigt efter hinanden; skiftende billeder kaldes også for "blinkies".
Browseren behandler billed-serie-GIF-filen som om det kun var et enkelt billede, dvs. der indsættes kun et link / handle (billedholder mærke) i HTML dokumentet; bruges især til banner reklamer der skifter.
Google mere information om diverse andre billedformater ....

Gåde råd om indscanning:

Jo større billeder og jo større opløsning (DPI) der scannes ind med jo mere fylder billedet henh. på skærmen (uden reduktion) og i fil størrelse (Kb) og desto langsommere bliver overførsel af billeddata over Internet til visning i browser / eller modtagelse i en email klient. Der må ofte gås på et passende kompromis alt efter hvad formålet med scanningen er ....

Jeg har haft flere scannere lige fra ret dårlig / lav kvalitet til supergod kvalitet og som kom med mange forskellige programmer og jeg har erfaret af standard indstilling af det med scanner
følgende program giver næsten aldrig det bedst mulige resultat af indscannet TEKST ....
De fleste scanneres standard indstilling er nemlig instillet til at langt de fleste overvejende bruger deres scanner til at indscanne mindre farve fotos i passende størrelse og rimelig kvalitet til fremvisning på en alm. computer skærm eller på en Internet hjemmeside, f.eks. Facebook f.eks.; standard indstilling af scanneren er ikke velegnet til at give rigtig pæn (foto kopi lignende) udskrift af billeder eller tekst på en fotoprinter el. laser printer, endsige til OCR.

Det giver altid bedste udskrift kvalitet om man tilpasser sin indscanning til den kvalitet der senere skal behandles / afleveres videre til printer henh. skærmen i, derfor start med at tjekke hvad dit udstyr / modtageren af "normalt udstyr" kan!
Rimeligt gode fotoprintere til hjemmebrug udskriver typisk mindst med maks. 1200-2400 DPI ...
Det er spild af krudt / plads at scanne ind i 2400 DPI farve kvalitet, hvis det indscannede bagefter maks. skal kunne udskrives på 1200, 600 eller 300 DPI laser printer i sort hvid kvalitet eller kun skal kunne vises på en skærm i VGA kvalitet (640 * 480 pixels)!


Inden du starter scanneren skal du altså gøre dig klart hvad det indscannede skal kunne bruges til og afpasse din opsætning af scanner til det:


1. Kun FOTOGRAFIER indscannes i farver eller gråtoner, alt efter billed type!
Farvebilleder kan ofte med fordel senere konverteres programmæssigt til gråtonebilleder i et andet billed behandlingsprogram uden tab af detajler / kvalitet sml. med et farvebillede der blev indscannet fra scanneren i gråtone, men farvebilledet fyldere mere på harddisken end gråtonebilleder gør.
* Hvis fotoet kun skal vises i lille størrelse på computer skærm / Internet hjemmeside og ikke behøver at kunne forstørres / udskrives på printer kan mindre farve billeder med fordel indscannes i lav opløsning; 75 DPI vil gøre sig tilpas godt på computer skærmen, filen fylder ikke ret meget og indlæses derfor rimeligt hurtigt af modtagerens browser og tåler udskrift på printer i normal størrelse, men tåler ikke forstørrelse.
* Hvis fotoet skal kunne forstørres på skærmen eller i printer udskrift på en 300-600 DPI printer (alm. laser printer) kan farve billeder med fordel indscannes i 150 DPI, det tåler let forstørrelse x 2-4 uden at billedet kommer til at se alt for kornet / kantet ud på papir udskriften!   
* Hvis fotoet ikke skal kunne ses på computer skærm, men istedet skal kunne udskrives på professionel fotoprinter i højest mulige kvalitet med mange fine farver og detaljer bevaret og skal kunne tåle meget stor forstørrelse uden at hakke i linier (fotostat), så må fotoet nødvendigvis indscannes i den højest mulige opløsning, som scanneren / foto-apparater tillader typisk 1200-2400 DPI for en privat hjemmescanner ... 
HUSK at Indscannede fotos / sider i meget høj kvalitet let kan komme til at fylde mange Mb per side, så filer måske bliver alt for store til at kunne sendes via email men må brændes på CD/DVD og sendes med snegleposten til modtager; mange gratis web-basrede email adresser, f.eks. hotmail, Gmail o lign. tillader måske maks. at sende 1-2 Mb filer som vedhæftning til emails!
Kend dit system og dets begræsnninger!

2. sider med sort TEKST skrevet på hvid baggrund skal scannes ind som SORT-HVID og minimum i 300 DPI kvalitet for at give flot printer udskrift eller hvis teksten skal kunne bruges til OCR oversættelse til computer tekst!
Gammeldags FAX format var på kun 200 DPI, og det gav som sikkert bekendt temmelig grynet og lidt for dårlig udskrift kvalitet på en alm. 300 DPI laser printer, ikke helt godt nok til OCR .
OCR står for "optical character recognition", dvs. computeren læser billedet og oversætter automatisk læste tegn til sammenhængende computer tekst; det er netop ofte hvad indscannede tekst-sider skal kunne bruges til!
Hvis en tekst side uheldigvis er scannet i farve eller gråtone og bagefter forsøges konverteres til sort-hvid så bliver baggrunden for teksten som regel fuld at sorte prikker og selve teksten kommer til at lyse "huller" dvs. kontrasten mellem sort tekst og hvid baggrund bliver for dårlig til at karakterer kan genkendes af OCR programmet, så den resulterende tekst måske ikke bliver læsbar!

3. Hvis der er komb. af tekst og billeder som begge skal gengives på en hjemmeside, så må teksten indscannes og OCR for sig, imens de tilhørende billeder fra siden indscannes separat i tilpas god foto kvalitet i farve eller gråtone til at kunne vises pænt på skærmen, som det f.eks vist på denne side: http://lymerick.net/1951-delamater.htm 


Yderligere TIPS der letter modtagerens gennemsyn af materialet:


Gør læsning så let og brugervenlig for din læser som overhovedet mulig!
Flerside dokumenter bør aldrig nogensinde sendes vises til læseren som enkelt stående scannede billed sider, med mindre der kun er en enkelt side; tekster der strækker sig over flere sammenhørende sider - som en bog eller artikel - skal altid pakkes i en enkelt fil hvor tekst siderne af sig selv bliver vist i korrekt læsevenlig rækkefølge, når filen åbnes ...
- fordi hvis læseren selv skal åbne forskellige filer enkeltvis er der stor risiko for læseren ikke får dem åbnet i korrekt læse-rækkefølge, så teksten ikke giver mening!?

Enhver computer bruger kan uden det koster penge komme til at danne flersidede PDF dokumenter ved at udskrive flere indscannede sider billeder til en "PDF printer"
Hvis man er rig kan man købe sig meget fattig i Adobes originale program, men de fleste kan nu klare sig ganske godt med den gratis CutePDF version, som kan downloade herfra: http://www.cutepdf.com
Sørg blot for at navngive de enkeltvis indscannede billeder på en måde så de vises i filmappen i korrekt rækkefølge; derfter er det bare at markere alle sider/billeder og højre klikke og vælge udskriv til CutePDF printeren; det virker i hvert fald udmærket på min Vista computer og med CutePDF, sådan at hver enkelt scannet side udskrives på hver sin side i PDF dokumentet og sådan at siden skaleres til at fylde hele A4-siden ud; men mit udskrift program vælger ofte "landskab", så det må lige rettes til før udskrift hvis det kommer til at stå vendt ...
Lettere kan det næsten ikke gøres at flette flere enkelt indscannede billeder sammen i et flerside dokument!

Mange uerfarne computer ejere bruger tilsyneladende kun de specielle programmer der fulgte med den bestemte scanner de købte og de scanner automatisk på kun den måde som scanneren foreslår som standard, uden at sætte sig ind i hvilke andre indstillings muligheder der er ...
- men hvis man vil scanne ind til andet end sit eget brug, så skylder man læseren at sætte sig ind i hvordan det bedst mulige resultat opnås for læseren!

Mmange uerfarne computer brugere er ikke klar over at der allerede er installeret nyttige programmer på deres computer f.eks. til OCR og de bruger måske penge på at købe ekstra programmer de godt kan klare sig uden eller som kan findes i næsten professionel kvalitet som gratis Open Source programmer på Internet ....
Mange computere kommer således nuomdage som standard udstyr installeret fra fabrik med Microsoft Windows og en Microsoft kontor-pakke og computeren har måske allerede programmet Microsoft Document Imaging indbygget velegnet til scanning af tekster mhp. OCR oversættelse, som programmet er rigtig godt til faktisk! 

Op til og med Windows 2000 medfulgte det indbyggede scanner program Imaging / Kodak Imaging i Windows styresystemet; programmet kan faktisk stadig findes og installeres til funktion på XP og Vista systemer, hvis bare man har adgang til de oprindelige Kodak Imaging filer fra Windows 2000 og en forklaring på hvordan det kan gøres ...
Det gamle Kodak Imaging program er det bedste program til at rette / fjerne klatter fra indscannede multi-page TIF sider med, når man f.eks. ønsker at fjerne scannede "sørgerande" og skidt pletter og det giver desuden meget bedre mulighed for at kunne tilpasse sider til størrelse og format bare det er indscannet i samme DPI ...
Gråtone billeder kan hurtigt og let og konverteres til en noget bedre sort-hvid (mere grålig) version, end det er muligt at få frem, hvis man skanner et gråtone billede direkte ind i fra scanner i sort-hvid, hvor billedet ofte gøres sort at flere detajler i billedet går tabt ...
Sider hvor man selv vælger det område der skal indscannes kan være blevet indscannet i uens side størrelse evt. i forskellig DPI kvalitet, hvilket kan influere betydeligt på udskriften og giver uens indtryk, hvis man lader programmet selv tilpasse siden til A4 udskrift for eksempel, marginer kan få forskellig bredde osv. det ser ikke pænt nok ud ...
Microsoft Document Imaging (MDI) er desværre ikke helt så godt som det gamle Imaging til at fjerne uønskede "klatter" med eller tilføje tekster / stempler eller tilpasse uens sider til hinaden, men det kan til gengæld automatisk rette skævt indscannede sider op til lodret og kan køre OCR på indscannede tekster, så tekst let kan citeres!
MDI programmet kan gemme både i multipage TIF eller eget MDI format; sidstnævnte kan ikke læses af Imaging og indebærer vist ingen anden fordel end at den OCR'et tekst kan gemmes sammen med scanne billedet.
Begge programmer kan bruges til at flette enkelte sider gemt i TIF format sammen til multi-page TIF format, og begge kan bruges til at scanne yderligere siden til eksisterende dokument via TWAIN kilde ...
Kun når baggrunden for klar sort tekst er helt ren hvis og skæve sider er rettet op, kører OCR programmet bedst mulig; god indscanning medfører der kan spares til på at rette evt. computer oversættelsesfejl i den indscannede teksen bagefter! ... jeg bruger ganske meget at gemme / citere længere afsnit fra publicerede artikler, som jeg i sin tid fik fotokopi af hjem fra biblioteket; før i tiden kunne jeg bruge timer og sommetider dage på at skrive sådanne citater / tekster af manuelt, som jeg nu - med hjælp fra ovenstående 2 værktøjer, der ikke har kostet mig ekstra penge penge - kan scanne ind og OCR perfekt på kun få minutter; jo mindre manuelt arbejde jo hurtigere og jo bedre, jo mere andet kan man nå :)