Aktiver værdien af AI i dine dokumenter!

12 juni, 2024 af
OS2 – Offentligt digitaliseringsfællesskab, Jan Maack Kjerbye


Blogindlæg af Jan Maack Kjerbye, Enterprise arkitekt i OS2-fællesskabet.


Hvordan sikrer man sig at de dokumenter man forfatter er forberedte til at blive behandlet af kunstig intelligens? Der er basalt set tre hensyn der skal tages:



🔓 Brug et åbent standard format!

Åbne dataformater virker som en en universel nøgle til dine data, og sikrer, at de kan åbnes og forstås af mennesker og flere AI systemer på tværs af organisationer og platforme. Tag denne beslutning tidligt og undgå at blive låst til et bestemt system, leverandør eller organisation.


🏷 Inkluder metadata med en åben standard!

Metadata virker som en digital etiket på dit dokument. Det hjælper både mennesker og maskiner med hurtigt at forstå, hvad dit dokument handler om, hvem der skrev det, og hvornår det blev skrevet.


📤 Garanter fri adgang!

Distributionsmetoden for dine dokumenter er en ofte overset, men afgørende faktor, der har afgørende betydning for andre organisationer og deres muligheder for at behandle dokumenterne. Ved at vælge en uafhængig og åben distributionsmetode elimineres afhængigheder af enkeltpersoner og leverandører.


Introduktion

Måske er det uklart om de ovenstående hensyn overhovedet har relevans for dig og hvilken betydning det kan have ikke at følge dem? Hvorfor skal du vide noget om formater og distributionsmetoder som ophavsmand til et dokument? Lad os prøve at illustere dette ved at starte med en fiktiv historie inspireret af virkelige hændelser:

Jens, en offentlig ansat, udarbejder dokumenter til offentliggørelse. Han skriver og gemmer dem med hans sædvanlige værktøj og uploader dem til afdelingens standard dokumenthåndteringssystem. Med disse ubevidste valg starter han en kæde af problemer for både interne og eksterne samarbejdspartnere. Bl.a. for Anna, en fagperson i en anden offentlig organisation der gerne vil effektivisere sit arbejde ved at bruge et AI-værktøj til at analysere dokumenterne fra Jens' myndighed. Anna bruger dagevis på at skaffe adgang til dokumenterne og da hun endelig har hentet dem kan de ikke læses af det værktøj hun har til rådighed. Hun går i gang med at konvertere filerne manuelt, en for en, og halvvejs inde i processen opdager hun ved et tilfælde, at der er kommet nye versioner af nogle af filerne. Hendes tidsforbrug eksploderer. Hun sukker højt og stirrer tomt ind i computerskærmen.


"Skal jeg nu til at huske endnu et langt password? Hvilket af dokumenterne er mon nu det gældende? Hvorfor er denher tekst gemt som et billede? Hvad i alverden er en .CDR fil mon? Hvorfor skal det være så kompliceret?"


Formaterne og måden, dokumenterne er offentliggjort på, skaber en række grundlæggende barrierer og forhindrer dermed direkte, at andre organisationer effektivt kan anvende dokumenterne til at skabe tværgående værdi for borgere eller myndigheder.

Så hvad kan man man gøre, for at afhjælpe disse risici?



Sådan kommer du i gang

Her er nogle lavpraktiske anbefalinger, du kan følge for at komme i gang med at implementere de ovenstående hensyn om formattering, metadata og distribution:


1. Anvend åbne formater

De åbne standard formater Markdown og Mermaid er ideelle, da de er lette for både mennesker og maskiner at aflæse, uafhængigt af værktøjer, licensaftaler eller organisatoriske skel. De er dermed ideelle til at skabe grundlaget for interoperabilitet på tværs af offentlige sektorer.


Ⓜ️ Markdown

Markdown er et letvægts markup sprog med en simpel formateringssyntaks der er er let tilgængeligt for et bredt publikum af anvendere. Det er et læsbart, simpelt, fleksibelt og portabelt markup sprog, der er ideelt til samarbejde og vidensdeling. Der er mange måder at komme i gang med at lære mere om Markdown. Her er et par steder at starte:

Markdown på 60 sekunder: Markdown Reference

10 mins intro video: Academic Writing in Markdown

Kursusforløb ved Udemy: Markdown Mastery: Simple yet Powerful Writing Format


🧜‍♀️ Mermaid

Hvis man har brug for at inkludere simple diagrammer i sine dokumenter er Mermaid et åbent og simpelt format til generering af diagrammer og flowcharts der kan inkluderes inde i dit Markdown formatterede dokument. Ved at anvende denne måde at fremstille diagrammer på, kan man høste alle de samme fordele som man får ved at bruge Markdown. Og så er det simpelt og hurtigt at komme i gang med at lære. Herunder, har jeg et par forslag til steder man kan starte med at blive klogere på Mermaid.

5 mins intro video: Code your diagrams with Mermaid

Kom i gang med Mermaid: Mermaid User Guide


2. Inkluder metadata

FrontMatter skrevet i tekstformatet YAML er en simpel måde at tilføje struktureret metadata til sine Markdown dokumenter. Det gør det nemt at håndtere og organisere indhold og det fremmer samarbejdespotentialet ved at standardisere dokumentinformation på tværs af bidragydere og værktøjer.


📄 Front Matter

En af styrkerne ved at vælge Markdown som formatterings sprog er den simple måde hvorpå metadata kan tilføjes integreret i dokumentet. Det gøres nemt og ukompliceret ved at oprette en forside, en såkaldt Front Matter formatteret i det åbne standardformat YAML.

GitHub Docs: Using YAML frontmatter

Denne uafhængige og bredt anvendte måde at inkludere metadata på er både nem og hurtig at komme i gang med, men indeholder samtidigt meget kraftfulde muligheder som man kan tage i anvendelse i takt med at man lærer mere.


3. Garanter fri adgang!

Den simpleste måde at gøre dokumenter tilgængelige for alle modtagertyper er at tilpasse arbejdsgangen for distribution og opbevaring af de delte dokumenter

Ved at vælge en åben, standardiseret samarbejdspraksis kan du opnå en fremtidssikret og uafhængig deling.


🔖 Versionsstyring og deling

En meget anvendt åben standard, er at gemme dokumenterne med versions-styrings værktøjet git og f.eks. bruge GitHub til at dele dokumenterne. Hvis du har ambitionen om at gøre dine dokumenter tilgængelige for AI-behandling, er en åben, standardiseret og uafhængig metode til deling af metadata-mærkede dokumenter altafgørende.

For at komme i gang med at høste fordelene ved denne tilgang, kan man klikke ind på et par links jeg har samlet. Måske kan et eller flere af dem være din indgangsvinkel, til at komme i gang med at lære mere:


Video tutorial serie: Git and GitHub for Poets

Gevinster ved at bruge versionsstyring (43 mins) : Writing a Book Using Git and Staying Organized on a Project - YouTube

Interaktivt kursus via GitHub Skills: Organize ideas and collaborate using Markdown, a lightweight language for text formatting.

Kursus på Udemy: Git and GitHub for Writers


🔧 Lidt om værktøjer


Hvilket værktøj man skal vælge til at arbejde med åbent formatterede dokumenter, kommer helt an på hvilke opgaver man forsøger at løse

Heldigvis er man også i værktøjsvalget godt stillet når man vælger at bruge åbne standardformater. Frihederne og åbenheden omkring Markdown og Mermaid formaterne betyder at der findes hundredevis af tilgængelige værktøjer.


Opensource.com: Open source Markdown editors

Markdownguide.org: Markdown Tools

GitHub: A collection of awesome markdown editors


Denne fleksibilitet kan virke overvældende, men det store udvalg er med til at sikre at du altid har adgang til at redigere og tilgå dine dokumenter. Vælger man at anvende en webbaseret tjeneste som GitHub til at samarbejde om sine åbne dokumenter, kan man endda vælge kun at bruge den webbrowser man allerede har installeret på sin maskine.

Foretrækker man at arbejde lokalt, kan en anden nem og hurtig måde at komme i gang med at skrive dokumenter på, være det begyndervenlige værktøj MarkText. Jeg har udvalgt at par links der beskriver både den rene browserbaserede og den lokale måde at komme i gang på.


Video tutorial serie: Git and GitHub Tutorials for Beginners!

Opensource.com: Why Mark Text is my favorite markdown editor

itfoss.com: Marktext is an Excellent Editor Even for Those Who Dont Know Markdown


Det var mit pip om åbenhed for denne gang. Jeg håber det nu står mere klart, at versionsstyring af åbne dokumenter ikke blot er en kedelig teknisk øvelse, men en nødvendighed for at låse op for kunstig intelligens’ fulde potentiale. Jeg vil opfordre mine læsere til aktivt at overveje og anbefale disse metoder som strategiske investeringer i fremtidige arbejdsgange. Arbejdsgange der vil muliggøre en mere effektiv og værdiskabende udnyttelse af data som ressource.


All illustrations in this blogpost are generated by DALL·E 3

# AI
Tags
AI