Hopp til innhold

Brukerdiskusjon:TorbjørnS-AWB

Sideinnholdet støttes ikke på andre språk.

Om denne tavlen

Asav (diskusjonbidrag)

Nå driver bot-en med å endre alle forekomster av «satsning» til «satsing». Det er faktisk to forskjellige ord. Det første betegner en handling, det sistnevnte et resultat. Slik er det med alle ord som ender på ing og -ning på norsk. (Og -else, når det er avledet av samme rot, angir et resultat.) Denne boten bør ikke foreta flere inngrep av dette slaget, og denne kjøringen (samt evt. lignende) må tilbakestilles.

TorbjørnS-AWB (diskusjonbidrag)

Det er ikke noe som heter satsning i ordboka.

TorbjørnS-AWB (diskusjonbidrag)
Asav (diskusjonbidrag)

«Det er ikke noe som heter satsning i ordboka.»

Ikke i din ordbok, nei. Språkrådet er en bokmålsinstitusjon, og det styrer ikke ordtilfanget i Wikipedia, like så lite som regjeringen styrer artiklene om statsbudsjettet.

Skillet mellom suffiksene -ing, -ning og -else er velkjent; dette må altså tilbakestilles.

Jeblad (diskusjonbidrag)

I dette tilfellet mener jeg Språkrådet har rett, «satsning» er en skrivefeil.

TorbjørnS-AWB (diskusjonbidrag)

I enkelte tilfeller er det nødvendig å skille mellom -ing og -ning, som for eksempel i "byggingen av bygningen har begynt nå". Når det gjelder ordet satsing er det ikke et slikt behov for å skille. Det er kun substantivet satsing som har en slik endelse, mens handlingen (verbet) å satse bøyes på andre måter. En rekke unødvendige -ning-former ble kuttet ut engang før min tid, ifølge Språkrådet, mens de er beholdt der det er behov for dem.

Asav (diskusjonbidrag)

Igjen: Satsing er handlingen som fører til en satsning, som er resultatet av satsingen. Det er to forskjellige begreper med to forskjellige ord. Det er riktig at hensikten med bokmålet, som forvaltes av Språkrådet, er å forenkle og redusere ordtilfanget mest mulig, men det er ingen automatikk i at Wikipedia skal følge opp denne aktiviteten i blinde, slik det er skjedd her.

Jeblad (diskusjonbidrag)

For å sitere Språkrådet; «Det er satsing som må regnes som det korrekte på norsk, både på bokmål og på nynorsk, og enten en sikter til handlingen (prosessen) eller resultatet.»

Og ikke minst i en henvisning til Bokhylla; «Det første tilfellet av «satsningen på» er fra 1968 og er svensk.»

Tror nok jeg mener dette er en skrivefeil.

Asav (diskusjonbidrag)

Ja, men det er altså ikke Språkrådet som redigerer Wikipedia. (Jeg er fristet til å si akkurat som det ikke er Blindeforbundet som stiller juryen ved Høstutstillingen.) Som jeg sa i tilsvaret over, har bokmål et ganske begrenset ordtilfang, og historisk sett har det vært et mål å avskaffe alle ord som ender med -ning og -else til fordel for -ing-endelser (unnskyld, endinger.) Det er blant annet derfor bokmål ikke kan skille mellom farven sort og tilstanden svart, for å ta ett eksempel blant mange hundre. Men dét er altså ingen grunn til at en Wikipedia-bot skal «rette» på ord Språkrådet mener er verboten.

TorbjørnS-AWB (diskusjonbidrag)

Dette er Wikipedia på bokmål og riksmål. Hvis du mener vi skal bruke et annet skriftspråk, oppdiktet eller reelt, foreslår jeg at du tar dette opp som en prinsippdiskusjon på ting eller torg.

Svar på «Satsing og satsning»
Jeblad (diskusjonbidrag)

Ser du bruker en konstruksjon <Typo word="Aserbajdsjan" find="\b(A|a)serba[ij]ds[ijy]an(s)?\b" replace="Aserbajdsjan$2" /> hvor du har en capture (s)?. Dette vil gi en eksistens/ikke eksistens av capturen, og det er implementasjonsbetinget hvordan denne vil oppføre seg. En mer pålitelig måte å skrive dette er (s?) eller (?:s)?. Første variant fungerer alltid, mens den siste er en utvidelse som ikek alltid er støttet. Den vil ikke lage en capture, og dermed får en ikke problemet med ikke-eksisterende capture.

TorbjørnS-AWB (diskusjonbidrag)

Et problem er at i utgangspunktet kunne jeg ikke noe om hvordan man skulle skrive disse tingene, og ut fra det jeg lærte fra Telaneo er det meste selvlært, noe som ikke nødvendigvis betyr at det er vellært. <Typo word="Aserbajdsjan" find="\b(A|a)serba[ij]ds[ijy]an(s)?\b" replace="Aserbajdsjan$2" /> er ment å skulle fange opp uttrykkene "Aserbajdsjan" og "Aserbajdsjans" i tekster. Forstår jeg deg riktig hvis du mener alle slike "(s)?" bør byttes til "(s?)"?

Jeblad (diskusjonbidrag)

Ja, men test det på en regel først. Problemet er at (foo)? sier at parentesuttrykket («capture») skal finnes en eller ingen ganger. Noen implementasjoner tolker dette som innholdet i parentesen og beholder selve parentesen, mens andre hiver også selve parentesen. Når jeg vil være helt sikker på hva som skjer så bruker jeg formen ((?:foo)?) som er mest generell, eller i dette tilfellet så kan en forenkle til (s?).

Merk at det ikke er feil å bruke formen du har brukt, så sant det fungerer i AWB, men at uttrykket ikke er fullt så portabelt som det kunne vært.

Jeg er litt imponert, for jeg vet hvor mye tid som går med til fikling når en skal lage regulæruttrykk!

TorbjørnS-AWB (diskusjonbidrag)

Ja, det går mye tid, og jeg skulle ønske jeg forsto dette bedre. Jeg skal prøve senere å teste med å bruke "(s?).

TorbjørnS-AWB (diskusjonbidrag)

Vil det samme gjelde for et uttrykk som for eksempel <Typo word="kasakhstansk/-er" find="\b(K|k)a(s)?(z)?ak(h)?stan(er|sk)?(e|en|ne)?(s)?\b" replace="$1asakhstan$5$6$7" />? Skal det da være <Typo word="kasakhstansk/-er" find="\b(K|k)a(s?)(z?)ak(h?)stan(er|sk)?(e|en|ne?)(s?)\b" replace="$1asakhstan$5$6$7" />, siden AWB-en skal lete etter om det eventuelt forekommer en "s" eller en "z", en "h" og "er" eller "sk" og så videre? Da blir det mye omarbeid, og siden det ser ut til å fungere slik det er i utgangspunktet tror jeg ikke jeg gjør dette inni uttrykkene også.

Jeblad (diskusjonbidrag)

I tilfellet …stan(er|sk)? så vil riktig form bli …stan((?:er|sk)?), så ja, det er mye fikling. Fungerer det greit som det er så la det stå.

TorbjørnS-AWB (diskusjonbidrag)

Skal ikke mase på deg om disse tingene, men jeg lurer litt på følgende: Er det slik at riktig form i …stan((?:er|sk)?), i tillfellet kasakhstaner/kasakhstansk, er riktig fordi man i dette tilfellet KUN leter etter kasakhstaner/kasakhstansk og ikke kasakhstan/Kasakhstan? I så tilfelle, blir det da slik at nedenstående tilfelle IKKE er riktig, fordi man både leter etter circa, circapris, circasum og circatall - mens nedenstående tilfelle VILLE VÆRT riktig om man kun lette etter circapris, circasum og circatall, men ikke tilfeller i teksten der det bare står "circa"?

<Typo word="cirka" find="\b(C|c)irca((?:pris|sum|tall)?)((?:en|ene|et)?)(s?)\b" replace="$1irka$2$3$4" />

Jeg har ikke testet dette siste uttrykket, og jeg får kanskje svar på dette om jeg gjør det, men for forståelsens skyld kunne det være greit å få bekreftet/avkreftet "teorien" min. Takk.

Jeblad (diskusjonbidrag)

En rå parentes () er et capture av det som står inni uttrykket. Et capture er noe som lagres for senere bruk. En kan telle venstreparentes for å finne ut hva nummer en skal ha etter dollartegnet for å hente ut akkurat denne biten. En parentes med et spørsmålstegn som første tegn har spesielle betydninger, og er ikke et capture. Det finnes flere slike, men det som er enklest å forstå er formen (?:…). Denne fungerer som en vanlig parentes, men altså uten å lagre det som er funnet til senere. Spørsmålstegnet som kommer etter høyreparentesen er som for vanlige tegn, det angir at det som er foran skal forekomme en eller ingen ganger. Ofte kan du erstatte dette spørsmåltegnet ved å sette inn et tomt element blant alternativene. (Spørsmålstegnet blir omtalt som en quantifier.)

Disse to er identiske (brøkstreken nedenfor er kun for å få riktig formatering)

/test(?:foo|bar|baz)?/
/test(?:foo|bar|baz|)/

Hvis du vil ha siste halvdel av uttrykkene inn i en capture så er det enklest å forenkle siste linja, for da er det bare å gjøre den om til en ordinær parentes

/test((?:foo|bar|baz)?)/
/test(foo|bar|baz|)/

Den siste linja ser jo enkel ut, men den kan av og til lage problemer. Det har med hvor hissigt uttrykket er på å fylle de forskjellige bitene. Hvis du henger på en \b der ordene skal brytes så går det som oftest bra, men test det. Av og til virker det som det tomme alternativet gjør at en får noe som tolkes som [test]+[tomt ord]+[ordgrense] og ikke som [test]+[ordgrense]. Da går ting i ball.

Linja du har skrevet ville jeg nok skrevet som en av (den finner også «circa»)

<Typo word="cirka" find="\b([Cc])irca(pris|sum|tall|)(en|ene|et|)(s?)\b" replace="$1irka$2$3$4" />
<Typo word="cirka" find="\b([Cc])irca((?:pris|sum|tall)?(?:en|ene|et)?s?)\b" replace="$1irka$2" />
<Typo word="cirka" find="\b([Cc])irca((?:pris|sum|tall|)(?:en|ene|et|)s?)\b" replace="$1irka$2" />
<Typo word="cirka" find="\b([Cc])irca((pris|sum|tall|)(en|ene|et|)s?)\b" replace="$1irka$2" />

Alle skal fungere (jeg har ikke sjekket) men det finnes ingen entydig fasit om hva som er rett. Legg merke til at i siste uttrykk lager jeg flere capture, men jeg bruker kun to av dem.

Hvis du ikke skal finne «circa» alene så kan du fjerne det første tomme alternativet eller tilsvarende quantifier

<Typo word="cirka" find="\b([Cc])irca(pris|sum|tall)(en|ene|et|)(s?)\b" replace="$1irka$2$3$4" />
<Typo word="cirka" find="\b([Cc])irca((?:pris|sum|tall)(?:en|ene|et)?s?)\b" replace="$1irka$2" />
<Typo word="cirka" find="\b([Cc])irca((pris|sum|tall)(en|ene|et|)s?)\b" replace="$1irka$2" />

Den kanskje viktigste grunnen til å bruke (?:…) er at denne formen er litt raskere enn en full capture. I veldig komplekse uttrykk kan det være viktig. Den andre grunnen, og som av og til kan være minst like viktig, er at en kan unngå capture som kan lage krøll.

Det er en form av quantifiers som kan være nyttig om du ikke får kontroll på et uttrykk. Hvis du skal finne «noe foran ing eller ingenting» så skulle en tro at noe ala dette løser problemet

/\b(.*)(ing|)\b/

I nokså mange systemer vil du finne at om du tester med «ting» så havner alt i $1 og ingenting i $2, dvs [ting]+[]. Det er nokså frustrerende. Grunnen er at den første captur'en er grådig (greedy) og sluker alt før den begynner å rygge tilbake, men i dette tilfellet får den lov til det pga det tomme alternativet i den andre capture'en. For å komme ut av dette så kan en bruke en not-greedy variant. Dette slår en på ved å hekte på spørsmålstegn etter asteriksen, altså en bruker to quantifiers som er litt ulogisk

/\b(.*?)(ing|)\b/

I dette tilfellet vil «ting» bli delt i [t]+[ing]

Danmichaelo (diskusjonbidrag)
TorbjørnS-AWB (diskusjonbidrag)

Har ikke brukt disse, men virker som noen verktøy som jeg burde ha brukt for lenge siden. Har jeg brukt feil variant?

TorbjørnS-AWB (diskusjonbidrag)

greier ikke se noen forskjell mellom de tre variantene?! :)

Danmichaelo (diskusjonbidrag)

De to siste er like, men den første er litt forskjellig. Se nøye på den høyre siden så ser du at det går en mulig rute rundt "group #2" (som er det som havner i $2), mens for de to andre så går ruten alltid gjennom "group #2". Sorry hvis dette bare ble forvirrende, men jeg synes det var litt morsomt at man kunne se forskjellen her :)

Jeblad (diskusjonbidrag)

Hvis du bruker et regulæruttrykk ala

/^(foo) (bar)? (baz)$/

Og tester på en string

 foo bar test

så får du vanligvis det du forventer

$1; // foo
$2; // bar
$3; // baz

Men skriver du

 foo baz

så kan du i noen implementasjoner få

$1; // foo
$2; // baz
$3; // <tom>

Dette er jo ikke riktig, for baz skal i slot tre, og slot to skal være tom.

Grunnen er at det er angitt at capture nummer to kan finnes med det etterfølgende spørsmålstegnet. Dermed hoppes den over for å få regulæruttrykket til å gå opp, og fordi slot to er ledig så brukes den for capture som skulle vært i slot tre. Det er jo opplagt…

For å unngå dette bruker mange (de fleste?) implementasjoner en løsning hvor venstreparentesen telles og dette nummeret angir hvilken slot som skal brukes.

Jeblad (diskusjonbidrag)

Det skumleste er at det ofte er uklart hvilken mer eller mindre uoffisiell standard som følges. Det kan slå ut på slikt som hvordan linjeskift behandles, hva som er linjeskift, karakterklasser, lookahead og lookbehind, osv.

TorbjørnS-AWB (diskusjonbidrag)

Har prøvd å sammenligne litt med for eksempel den engelske lista, og jeg tror måten jeg har gjort det på er lik deres måte å gjøre det på på mange områder.

TorbjørnS-AWB (diskusjonbidrag)

Men, hvis du sammenligner typolista nå med slik den var før denne diskusjonen startet... var det noe i den duren som jeg har gjort du mente, Jeblad?

Jeg har fryktelig lyst til å legge inn en streng som fanger opp feil med datoskrivning, og har tenkt lenge på å spørre om hjelp til dette på den engelske disk.siden. Kanskje en av dere kan hjelpe? Har sett slike strenger på den engelske og tyske typolisten, men de skriver jo ikke slik som oss.

Noe som kan gjøre at 1.Januar/1.januar/1 januar/1. Januar etc gjøres om til 1. januar etc?

n

Jeblad (diskusjonbidrag)

I perl er det mulig å gjøre noe ala

s/(\d+)\.?\s?((?i:jan|feb|mar|apr|mai|jun|jul|aug|sep|okt|nov|des))/$1. \L$2/

Litt merkelig den der… Først finner uttrykket tall, så mulig punktum og whitespace, så innledning av månedsnavnet. Fordi uttrykket er tilstrekkelig langt går det sannsynligvis bra med matchingen. Når erstatningen settes opp så tvinges strengen til lowercase.

TorbjørnS-AWB (diskusjonbidrag)

Prøvde å lage en selv, men den ble mislykket. Skal prøve denne. Takk.

Jeblad (diskusjonbidrag)

Du finner litt om escape sequences på , men merk at det er store forskjeller i hva som er implementert i de forskjellige bibliotekene.

TorbjørnS-AWB (diskusjonbidrag)

Noe jeg også tenkte å spørre på den engelske diskusjonssiden om... det virker som om det er en streng man kan putte på for å ta ord/uttrykk som står innenfor to punktum, men dette er ikke så interessant egentlig, men fins det en måte å gjøre at de også tar uttrykk innenfor klammer [[ ]]?

Jeblad (diskusjonbidrag)

Du kan escape klammene

/\[\[([^\]\|]*)\|?([^\]]*)\]\]/

Her er det en ytre avgrensing, dernest en første indre capture som er greedy opp til første pipe eller hakeparentes, spiser så en eventuell pipe, før den neste capture spiser greedy resten. Hvis den siste parentesen ikke er tom så brukes pipeformen (dobbeltformen), hvis den er tom så er ikke pipeformen brukt. Merk at du i tillegg kan ha tegn som legges til foran første hakeparentes eller etter siste hakeparentes. Vi bruker bare linktrail-reglene, som er a-zæøå. Disse burde utvides, jeg mener vi bruker feil apostrof blant annet. Står litt på phab:T130451

Svar på «Tvetydighet i AWB-regler»
Asav (diskusjonbidrag)

Jeg tror denne boten bør avstå fra å innføre særskriving. Jeg vet ikke om «på egen hånd» er korrekt bokmål (men det skulle ikke forundre meg, heller!) Derimot er det en desidert korrekt for på tradisjonelt riksmål. Jeg antar de fleste nordmenn ville skrive «på egenhånd». I det hele tatt råder jeg deg til å reversere alle særskrivningshandlinger boten-en har utført og la den behandle åpenbare skrivefeil istedenfor. Det du har nå, er en bot som oversetter fra korrekt riksmål til tvilsomme bokmålsformer, og dét var antageligvis ikke hensikten?

Danmichaelo (diskusjonbidrag)

Det blir selvfølgelig feil å oversette fra riksmål til bokmål, men å kalle det «særskriving» og «tvilsom bokmål» er helt unødvendig da «på egen hånd» både er korrekt bokmål og den mest brukte formen.

TorbjørnS-AWB (diskusjonbidrag)

Vil vel egentlig tro at "på egen hånd" er den eneste korrekte bokmålsformen. Om det er en egen riksmålsform vet jeg ikke. Jeg rettet opp i disse etter en forespørsel om å gjøre det på diskusjonssiden, og var i tvil om jeg burde gjøre det fordi når det gjelder slike uttrykk er det alltids ett eller annet (det går jo ikke an å rette på noe i norsk... håpløst). Dette ble et engangstilfelle, og jeg kjører ikke rettinger på akkurat den flere ganger.

TorbjørnS-AWB (diskusjonbidrag)

Bokmålsordlista skriver "på egen hånd". Alt hadde vært mye enklere hvis riksmålsordlista hadde fungert slik at man kunne sjekke riksmålsformer også.

Jeblad (diskusjonbidrag)

Messa med innlegget, det var nowiki-tagger i det. Antakelig fordi det var skrevet wikimakrkup i VisualEditor. Utgaven av VE som Flow bruker er litt utdatert…

Asav (diskusjonbidrag)

Det er en svært enkel løsning på dette, nemlig å la være å kjøre særskrivningsjobber med bot-en og å reversere dem som allerede er foretatt! Hva angår søket på nb-basen, er det forresten tilnærmet meningsløst, siden korpus er altfor begrenset.

Danmichaelo (diskusjonbidrag)

Fortsatt litt mindre meningsløst enn vill gjetting om hva «de fleste nordmenn ville skrive».

Jeblad (diskusjonbidrag)

Når en frase kan angis i størrelsesorden 105 antall treff, så er en nok godt forbi punktet hvor en kan si noe om hva som er korrekt bruk av begrepet. Skal en si noe om hva som er vanlig må en derimot gjøre dette om til relative antall forekomster. Er det en riktigere form når noe skrives fire ganger oftere på en form enn en på en annen? Jeg hadde nok helst sett at noe er mer enn 10 ganger vanligere før jeg ville snakket om at noe er riktigere, men vi kan uansett si at en form er vanligere ved en faktor på fire.

Hvis bokmålsordboka sier det er greit så rett ivei, «på egen hånd» er sikkert ikke mer feil enn «på egenhånd». Språkrådet bruker også formen.

Danmichaelo (diskusjonbidrag)

Har egentlig ikke lyst til å tvære dette ut enda lenger, men jeg skrev altså «både er korrekt bokmål og den mest brukte formen», ikke «er korrekt bokmål fordi det er den mest brukte formen». At den er riktigere (eller ''mindre feil'') bokmål følger av at det er den eneste formen som står i bokmålsordboka. Men så var det altså riksmål da, som var det springende punktet her.

Svar på «Særskriving»

LanguageTool, gjenbruk av materiale

1
Sammendrag av TorbjørnS-AWB

ok.

Jeblad (diskusjonbidrag)

På siden mw:Help:LanguageTool/Reuse of content from nowiki er det et varsel om at materiale fra Wikipedia vil bli gjenbrukt i regler for w:LanguageTool. Du får denne meldingen fordi du er en av hovedbidragsyterne på en eller flere av sidene som gjenbrukes, det vil si en av de fem største bidragsyterne. (Regner denne kontoen som samme bruker som TorbjørnS.) Fordi lisensen GNU Lesser General Public License som brukes for de aktuelle reglene i LanguageTool er litt annerledes, så er det mulig å si nei til gjenbruk. I de tilfellene vil jeg skrive de nødvendige reglene fra bunnen av. Etter ferdigstilling av et bibliotek for tokenizing vil reglene bli noe forenklet, og etter ferdigstilling av et bibliotek for inflection vil de bli svært mye forenklet. Når disse to bibliotekene er ferdige vil det nok ikke være mulig å gjenkjenne opprinnelsen til reglene. Nye regler er et pågående arbeid, og det vil ta tid før tilpasningene blir gjort allment tilgjengelig.

Wikijens (diskusjonbidrag)

Hei, jeg gikk nylig gjennom pekersider som også var merket som stubber, da dette er en kombinasjon som ikke er forventet. Enkelte av tilfellene (Galicia, TMK og Kapp Norvegia) hadde fått lagt inn stub-mal (med én b) av deg i forbindelse med annen korrigering. Var det bevisst, og hvis ikke, har du noen anelse om hvordan det har skjedd?

TorbjørnS-AWB (diskusjonbidrag)

Nei, det var ikke bevisst. Jeg antar det er fordi AWB-en har innlagt noen standardinnstillinger hvorav en av disse er å legge inn stubbmal på svært korte artikler. Jeg vet ikke hvordan jeg slår av denne funksjonen. Jeg er klar over at AWB-en gjør dette, så vanligvis klikker jeg bort slikt manuelt. Mulig jeg ikke har fått det med meg på akkurat disse. Håper det ikke var så alt for mange flere av disse.

TorbjørnS-AWB (diskusjonbidrag)

Forresten hvis noen vet hvordan jeg slår av dette vil jeg gjerne vite det. Dette var noe som plutselig dukket opp som standard på AWB-en for et halvt års tid siden.

Wikijens (diskusjonbidrag)

Nei, tror bare det var disse tre :-)

Sammendrag av TorbjørnS-AWB

Gjort.

Avilena (diskusjonbidrag)

Kan du legge til debutt* -> debut* på lista di?

TorbjørnS-AWB (diskusjonbidrag)

Ja, det skal jeg gjøre.

3.-plass?

21
Sammendrag av TorbjørnS-AWB

Det skal skrives 3.-plass, iflg. Språkrådet. Enige om å være uenige.

Ssu (diskusjonbidrag)
TorbjørnS-AWB (diskusjonbidrag)

Ja, er det ikke det? Det er slik jeg har skrevet plasseringer hele mitt liv. Å skrive 3. plass er jo en særskrivningsfeil. Hvis man skulle skrevet det med bokstaver blir det tredjeplass, ikke tredje plass. Kombinasjoner med tall og bokstaver skal ha bindestrek mellom. Fant en regel om dette på [http://www.sprakradet.no/sprakhjelp/Skriveregler/Dato/#målenhet Språkrådet] (underkapittel: Sammensetninger med tall som førsteledd), men den nevnte ikke slike plasseringer spesifikt.

Et googlesøk gir meg begge alternativer, fra "seriøse" kilder (aviser, NRK etc). Er det noen som vet en god kilde hvor man kan finne en regel som bekrefter/avkrefter dette? Greide ikke finne noe på korrekturavdelinga, så både Språkrådet og Korrekturavdelinga ser ut til å unngå akkurat presis hvordan plasseringer skrives.

TorbjørnS-AWB (diskusjonbidrag)
TorbjørnS (diskusjonbidrag)

Jeg skal unngå å korrigere disse frem til jeg vet noe mer sikkert enn egen hukommelse fra skolen. Har stilt spørsmålet til Språkrådet.

Ssu (diskusjonbidrag)

Språkrådet sier i alle fall at:

Også der førsteleddet er et siffer e.l., skal ordet skrives med bindestrek:

2.-prioritetslån, 50-årsdag, A4-format

Så da tror jeg faktisk du har rett - dette har jeg aldri tenkt på! :-) ~~~~

TorbjørnS-AWB (diskusjonbidrag)

Språkrådet svarer i mail til meg: "Det skal settes bindestrek i sammensatte ord med siffer: 4.-plass, 1.-divisjon osv. [...] unntak utgjør sammensetninger med ''klasse'' (i skolesammenheng) når disse uttales som to ord."

Eksempel: 4. klasse / fjerde klasse

mens i bestemt form (når det uttales i ett ord): 4.-klassen / fjerdeklassen.

TorbjørnS-AWB (diskusjonbidrag)

Så da tror jeg dette ble mye klarere.

Pdstud1975 (diskusjonbidrag)

Hei, beklager at jeg drar opp igjen en gammel tråd, men jeg ser du har endret plasseringer i Melodi Grand Prix-artiklene. (bindestrek mellom ordenstall og plassering, 4.-plass). Jeg ser også historikken i tråden her og har selv vært i kontakt med Språkrådet – som foreløpig ikke har gitt meg noen god fasit med eller uten bindestrek.

Jeg mener helt klart at det ikke skal være bindestrek mellom uttrykk som "2. klasse" og "1. plass". Dette ser en blant annet i praksisen til norsk presse, der plasseringer i overveldende grad skrives uten bindestrek. I ordboka er også "2. plass" skrevet uten bindestrek: http://ordbok.uib.no/perl/ordbok.cgi?OPP=plass&ant_bokmaal=5&ant_nynorsk=5&begge=+&ordbok=begge

Jeg mener vi gjør helt rett i å skrive slike uttrykk (også 1. divisjon, etc) uten bindestrek. Dette er velkjent for leserne, og det ser mindre "grisete" ut.

TorbjørnS (diskusjonbidrag)

Jeg mener man gjør helt rett i å skrive det slik det skal skrives, enten det ser grisete ut eller ikke. Jeg kan ikke svare for hvorfor ordboka har skrevet det slik de har, men jeg har forholdt meg til Språkrådet som helt konkret har svart på spørsmålet om det skal skrives 2. plass eller 2.-plass. Det er ikke nødvendigvis slik at noe er riktig selv om det ser "best" ut. Personlig skjønner jeg ikke problemet med å bare bruke den bindestreken...

Pdstud1975 (diskusjonbidrag)

Jeg skjønner deg helt og fullt, og jeg skal ikke «gå i krigen» for dette.

Min innsigelse skyldes først og fremst at bindestreken ikke er vanlig i skriftlig norsk, verken hos pressen eller oss «vanlige» skribenter (det bare å google og a-tekste, så ser du hva som er mest vanlig). Derfor mener jeg tegnsettingen kan skape forvirring og misforståelser – noe også denne tråden er et eksempel på (hvorfor ble den startet i det hele tatt? Jo, fordi noen stusset over skrivemåten).

Jeg har bedt Språkrådet om en grundigere redegjørelse om dette og avventer tilbakemelding fra dem.

TorbjørnS (diskusjonbidrag)

Mener du da det skrives andre plass eller andreplass, hvis man skriver det uten tall?

"Hun skulle gå av på andre plassen hun kom til etter å ha forlatt Oslo S med toget." "Da hun gikk av toget deltok hun i skiløpet der hun tok den litt kjipe tredjeplassen."

De to utrykkene har jo en viss nyanseforskjell som burde komme klart frem hvis man ser på de setningene.

Pdstud1975 (diskusjonbidrag)

Jeg mener en kan skrive det i både ett og to ord: "siste plass" eller "sisteplass", "tredje plass" og "tredjeplass" – akkurat som "femteklasse" vs "femte klasse". Det kommer an på hvordan du uttaler det.

TorbjørnS (diskusjonbidrag)

Javel... Språkrådet har klargjort akkurat det såpass greit, og svaret er gjengitt i innlegget ovenfor... så jeg gidder ikke bruke mer av dagen på å gjenta noe som allerede både er sagt og gjentatt.

TorbjørnS (diskusjonbidrag)

Limt inn etter feilplassert innlegg.

Hei,

Vet ikke om jeg svarer på rett sted, men prøver. Da jeg spurte Språkrådet tidligere i høst, fikk jeg følgende svar:

Du har rett i at mange skriver det uten bindestrek. Strengt tatt er ikke det feil, men det gjenspeiler ikke at ordet i dagligtalen hovedsaklig uttales i ett, altså «fjerdeplass». «2. plass» er det samme som «andre plass».

…………

Jeg mener derfor fremdeles det er fullstendig legitimt og i god språkskikk å skrive 3. plass uten bindestrek. Det er også det vanlige i norsk presse og for de fleste skriveføre (at denne diskusjonen i det hele tatt kom i stand, er vel bevis godt nok for dette). Når selv Språkrådet sier at det «strengt tatt» ikke er feil, mener jeg vi helt klart kan følge vanlig skrivepraksis og skrive plasseringer uten bindestrek. Slik jeg ser det, er bindestrek i dette tilfellet et unødvendig tegn som «griser» til tekst og tabeller, og som ser fremmed ut for leserne.

Jeg skal ikke gå i krigen for dette, for jeg er relativt ny på Wikipedia. Men jeg mener likevel at Wikipedia bør skrive plasseringer uten bindestrek. Jeg synes for øvrig at vi heller bør prioritere å rette dårlig språk og skrivefeil i artikler og saker på Wikipedia.

Hilsen

Pdstud1975

TorbjørnS (diskusjonbidrag)

Det er akkurat det jeg gjør... prioriterer dårlig språk og skrivefeil... som det å skrive 3. plass er... Når jeg gjør søk i retriever så dominerer sammenskrivning av ordene (altså "andreplass"/"tredjeplass"/"fjerdeplass") i omtale av sportsresultater. Et søk i nb.no, i eldre bøker som omhandler sport, dominerer skrivemåten i ett ord. Med utgangspunkt i at sangliste- og sportsplasseringer skrives i ett ord når de skrives med bokstaver, utkommer regelen om at hvis man bytter dette med en kombinasjon av tall og bokstaver så skal dette bindes sammen med en bindestrek (2.-plass, 3.-plass). Det er mer vanskelig å gjøre et godt søk på slike kombinasjoner (2. plass vs 2.-plass) fordi søkeresultatet mitt ikke kommer opp med gode resultater.

Denne diskusjonen har startet fordi det har vært tvil rundt dette. Hvis du ser, så ser du at de som har diskutert dette med meg har skjønt logikken, og forstått at det var noe i dette. Om du personlig mener det er godt språk å skrive 2. plass og tredje plass, så er det greit - og din sak. Ellers så er argumenter om hva du personlig mener er best å se på ikke så viktig for meg. At du mener det ser klumsete og rart ut med den bindestreken er ikke viktig for hva jeg gjør i denne saken, fordi det er ditt subjektive syn på saken. Jeg har selv mange ting jeg har skrevet slik jeg har skrevet det i alle år, og plutselig (på WP) fått en aha-opplevelse fordi det skrives slett ikke slik jeg skriver det. Da sjekker jeg ordbok for eventuelt å finne ut hva som er riktig, og forholder meg til det som er riktig, selv om det både kan se rart ut og klumsete ut.

En annen sak er at jeg i løpet av det siste halve året har fått mer og mer mistanke om at det kan være Wikipedias dårlige språk som påvirker dårlig språk ellers, og ikke like mye dårlig språk ellers som påvirker dårlig språk på WP (slik jeg først trodde). Hvis WP er landets sjette mest brukte nettsted, og elever i barne-, ungdoms- og videregående skole benytter WP som kilde, så er det også godt sannsynlig at mange andre skriver ting slik fordi det skrives slik på WP.

Jeg håper for øvrig man kan være ferdig med denne diskusjonen. Jeg har allerede rettet tusenvis av disse tilfellene (og per i dag er du den eneste som "protesterer). Jeg kommer nok ikke til å rette noen tilbake, og jeg kommer fortsatt til å ha denne korrigeringen i lista mi. Så er det vel godt mulig at alle som sitter på gjerdet og har lyst til å protestere venter til den siste korrigeringen når det gjelder dette er gjort...

Pdstud1975 (diskusjonbidrag)

Det var nå du som tok opp igjen dette – jeg er ferdig med saken. Vi får være enige om å være uenige, og jeg skal skrive 3.-plass heretter.

TorbjørnS-AWB (diskusjonbidrag)

Nei, jeg tok det ikke opp igjen, jeg merket saken som avsluttet, og oppsummerte den. :) ..en ting som det virker som det er en fordel å gjøre når man bruker denne upraktiske Flow-debattsiden... Jeg regnet ikke med at det var noe mer å diskutere siden jeg ikke hørte noe mer.

TorbjørnS-AWB (diskusjonbidrag)

Sånn for å ta noen tall: Et søk på "fjerdeplass" i Retriver gir 275 171 treff, mens et søk på "fjerde plass" gir 11 553 treff. Jeg gikk i gjennom de 100-200 første treffene til Norsk Telegrambyrå, og kunne i teksten se at der de oppga andre plasseringer i tillegg til "fjerdeplass" skriver de for eksempel 11.-plass. Søk på "4. plass" og "4.-plass" gir meg i begge tilfellene de samme 178 501 resultatene (jeg vet ikke hvordan man skal søke for å få søkeboten til å se forskjell på med eller uten bindestrek). Hvis man leser tekstene vil man finne eksempler på bruk av begge stavemåter. En rask kikk på resultatene fra Norsk Telegrambyrå som kommer opp blant de 178 000 resultatene ser ut til å vise at de nesten konsekvent (med enkelte unntak innimellom) skriver 4.-plass (over 10 000 treff, og gidder ikke sitte å gå gjennom alt).

Denne posten ble skjult av TorbjørnS-AWB (historikk)
Blue Elf (diskusjonbidrag)

Når språkrådet skriver "Strengt tatt er ikke det feil", så blir det ikke korrekt å endre det etter eget forgodtbefinnende her. Jeg har tilbakestilt en del av disse "rettingene". Blue Elf (diskusjon) 17. jun. 2017 kl. 19:01 (CEST)

Blue Elf (diskusjonbidrag)

Jeg har nå diskutert spørsmålet med språkprofessor Marit Julien. Hun mener det må være bindestrek hvis det uttales som ett ord, men uten bindestrek hvis det uttales som to ord. Jeg tror det er en liten uttaleforskjell mellom "hun kom på 19. plass" og "hun fikk en 19.-plass", og Marit er enig.

Dette er kanskje marginalt, men uansett tror jeg ikke det er lurt å "rette" på dette. Jeg tror det beste er å akseptere at noen foretrekker det ene og noen det andre, og la det bli med det. Å feie over slikt som dette med en bot er neppe noen god ide. Blue Elf (diskusjon) 17. jun. 2017 kl. 21:53 (CEST)

Svar på «3.-plass?»
Denne posten ble skjult av TorbjørnS-AWB (historikk)
Denne posten ble skjult av TorbjørnS (historikk)
Denne posten ble skjult av TorbjørnS-AWB (historikk)
Svar på «Målsetning»
Sammendrag av TorbjørnS

Etter mye om og men, fra min side...

Jeblad (diskusjonbidrag)

Ser du erstatter «det bysantinske rike» med «Det bysantinske rike», men er denne erstatningen riktig når frasen står inne i en annen tekst? Det vil hva er rett av «… fremveksten av det bysantinske riket kan føres tilbake til …» eller «… fremveksten av Det bysantinske riket kan føres tilbake til …». Det her er vel en substantivfrase som også brukes som egennavn? Jeg er ikke enig med meg selv om hva som er riktig. Er egennavnet viktigst i disse tilfellene?

TorbjørnS (diskusjonbidrag)

Jeg mener helt klart det skal være stor forbokstav siden '''Det bysantiske rike''' er navnet på et land, eller et rike, altså et egennavn. Med det mener jeg at det ikke er noe forskjell på setningen "framveksten av Det bysantiske rike kan..." og setningen "den økonomiske framveksten i Norge skyldes..." eller "naturen på De britiske øyer preges av...". Forøvrig er alle egennavn substantiv. Substantiv består av fellesnavn (et hus, et land, en hund) og egennavn (Det hvite hus, Storbritannia, Fido) og egennavnene skal alltid ha stor forbokstav (uansett plassering i setning og uansett setningssammenheng) - og om de består av flere ord skal alltid første ord i egennavnet ha stor forbokstav, og vanligvis ikke andre ord såfremt det ikke er egennavn i egennavnet.

TorbjørnS (diskusjonbidrag)

Hmm... mulig jeg svarte litt borti natta...

"Det bysantiske rike" er ikke en substantivfrase, det er et egennavn som består av tre ledd/tre ord. Disse tre ordene er i og for seg en substantivfrase, men så lenge denne frasen brukes som navnet på landområdet, så er det et egennavn. En bedre sammenligning: "Storbritannia, Irland og omkringliggende øyer utgjør til sammen De britiske øyene" (egennavn - De britiske øyene er navnet på øygruppa). "På de britiske øyene Angelsey og Man er det..." (substantivfrase - de britiske øyene i samme betydning som den norske øya Spitsbergen)

Jeblad (diskusjonbidrag)

Jeg er usikker på hva som er riktig i en god del av disse tilfellene. Gjorde noen søk på "det romerske riket" som skulle tilsvare omtrent "det bysantinske riket", og da dominerte liten forbokstav. Forskjellen er at "det bysantinske riket" er blitt etablert som egennavn på en helt annen måte, men hvor går grensa. Jeg vet ikke, men det blir helt sikkert mer riktig slik du gjør det. I alle fall blir det entydig!

TorbjørnS (diskusjonbidrag)

Problemet er at liten bokstav dominerer i alle disse uttrykkene (det romerske riket/det bysantiske/det osmanske), Årsaken til dette er at WP har masseprodusert feil i mange år, og disse feilene har man sikkert sett seg så blind på at man anser dem som riktige. Selv måtte jeg ta noen runder med meg selv for å finne ut om jeg i det hele tatt skulle tørre å ta i disse uttrykkene, for jeg har også sett at flertallet ligger på liten forbokstav. Dette er noe som ligger i samme kategori som 2.-plass eller 2. plass, som jeg var bombesikker på, men likevel måtte spørre Språkrådet om fordi det ikke forekom et eneste tilfelle av den riktige skrivemåten på WP.

Jeg vil forsåvidt også påpeke at det store flertallet jeg har rettet når det kommer til "det bysantiske riket" er ikke "det bysantiske riket", men "Det Bysantiske Riket", "det Bysantiske Riket", "det Bysantiske riket" eller "Det bysantiske Riket". Årsaken til at du ser det du ser i dag er rett og slett at jeg avslutter en mange månders retting av dette uttrykket (fra alle mulige varianter) der det stort sett bare lå igjen noen på "det bysantiske riket". Her er tydeligvis en forståelse av at det skal være noen store bokstaver, problemet virker bare å vite hvor de/den skal være...

Forsåvidt bare fint at du spør hvis du ser jeg gjør noe du ikke forstår eller er enig i.

TorbjørnS (diskusjonbidrag)

Med AWB-en min har jeg sett eksempler på skrivefeil som har blitt "kopiert" til titalls og hundretalls artikler fordi man har brukt samme "mal" på alle ("slurvefeil"). Utbredt er for eksempel en versjon av himmelretning+egennavn - "nord-Frankrike", "sør-Norge", "vest-Spania", "nord-Korea", "Nord Norge", "Sør Vietnam" og lignende - hvor variantene er uendelig mange og praktisk talt umulig å korrigere (umulig å legge inn alle mulige varianter i AWB-en). Når slikt får utarte seg, så ender vi opp med at om fem år så blir noen spurt hvorfor de korrigerer "nord-Norge" til "Nord-Norge", fordi man til slutt har sett så mange varianter av feilen at man hodet til slutt konkluderer med at den riktige er feil.

Det er ofte slik at det er en håndfull forskjellige personer som står bak veldig mange artikler om et spesifikt emne. Hvis en av disse personene har en formening om at det skrives "det bysantiske rike" og en annen har formeningen om at det skrives "det Bysantiske rike" - og disse to samlet skriver 50% av artiklene som omhandler dette emnet, så sier det seg selv at du ikke får mange resultater på "Det bysantiske rike" hvis man også kan anta at mange av de som har skrevet de resterende 50% av artiklene også har sine formeninger om hvordan noe skrives. Jeg har fått et helt annet perspektiv på typos etter å ha kjørt AWB i mange måneder nå... det værste av alt er at jeg bare har tatt toppen av isfjellet og jeg er faktisk fortvilt over situasjonen.

Jeblad (diskusjonbidrag)

Beklager maset, men har du noen idé om hvordan en kan unngå alle disse feilene? Er det kun feil som inkluderer artikler det lenkes til, er det noen typiske feil som går igjen, etc. Det jeg spør om er om vi på noe vis kan gi skribenter hint om tekster som inneholder feil. Nå tenker jeg høyt, jeg har ingen løsning i ermet, jeg prøver kun å se om vi kan få til noe. — Jeblad 17. nov. 2016 kl. 20:28 (CET)

TorbjørnS-AWB (diskusjonbidrag)

Jeg vet ikke. Min tanke er at når noen ser korrigeringen på overvåkningslisten så kanskje de unngår dette til neste gang... men i den store sammenhengen så hjelper ikke det nok. Hvis feilene kun hadde forekommet i lenker, hadde det ikke vært et så stort problem, men hvis man skriver "De Forente arabiske Emirater" i lenken, så har man sannsynligvis også skrevet det i resten av artikkelen. Det er svært sjelden jeg tar meg tid til å sjekke redigeringshistorikk, så jeg sitter ikke inne med kunnskap om "hvem som gjør hva" (det er heller ikke interessant for meg) - men jeg kan ofte konstatere ut fra et slags mønster at i noen sammenhenger har samme feil samme opphav, enten med at det dreier seg om samme person(er) eller at andre personer har gjort som disse andre personene.

Nå begynner det å bli en del innhold i disse kategoriene for omdirigeringer fra skrivefeil, og jeg kunne tenkt meg at man innførte "grønne lenker" hvis man lenker fra slike ord/uttrykk. Da ville det bli lettere synlig for leser og skribent. Jeg har også tro på at det er riktig og i større grad vurdere om "alle omdirigeringene noen lager til noe" er nødvendige. Så snart du har en omdirigering fra "De Forente arabiske Emirater" så har man også nesten en garanti for at noen vil legge inn uttrykket i artikler og får bekreftet deres tro på at det var riktig. Og det er det det hele dreier seg om... så snart man får bekreftet, eller så snart man "vet" at det man skriver er riktig, så kan man i verste fall ende opp med hundrevis av artikler som inneholder akkurat den feilen, alt etter hvor aktiv denne brukeren er. Deretter får man en dominoeffekt der andre som leser dette også tror at det er riktig. Ti forekomster av "spessiellt" er uproblematisk... 2000 tilfeller av "Den Engelske Kanal" er svært problematisk.

Jeblad (diskusjonbidrag)

Vi kan synliggjøre omdirigeringer, det finnes allerede en tilleggsfunksjon, men vi kan ikke på en enkel måte synliggjøre kategorisering av omdirigeringer på feilskrevne navn. Dvs vi kan få det til, men det trengs en del ekstra kode. Vi kan da gi en notis på siden om at den inneholder feilskrevne navn, og et lenkesymbol som blir rødt eller bruke en annen type feilmerking.

Det finnes også en tilleggsfunksjon for å synliggjøre pekersider. Disse er nok litt verre, for en pekerside er ikke nødvendigvis en skrivefeil selv om tittelen er littmerkelig.

Jeblad (diskusjonbidrag)
TorbjørnS-AWB (diskusjonbidrag)

Beklager at jeg også maser nå, men jeg har (ufrivillig) tenkt litt på det du spurte om (jeg har jo ikke lyst til å gjøre feil selv), og for det første tror jeg at jeg har svart deg på noe annet enn du spurte om (selvfølgelig vet du hva et egennavn er og selvfølgelig vet du at egennavn skrives med stor forbokstav - beklager).

Det du spør om er om det kan finnes "tvetydigheter" som gjør at, for eksempel, Det bysantinske rike av og til blir riktig å skrive med liten "d". Svaret mitt er: Dette har jeg også lurt på. Du poengterer "det romerske rike" som jeg rett og slett fjernet fra AWB-lista etter et par korrigeringer, nettopp fordi jeg ikke forsto hvorfor mange skrev det med liten -d, og nettopp fordi jeg begynte å spørre meg samme spørsmål som det du spør meg.

Mitt beste svar er: Jeg tror ikke du finner denne tvetydigheten når det gjelder "Det bysantinske rike" eller "Det osmanske rike" (eller "Det romerske rike"). Jeg har ikke greid å finne eksempler på, og ikke greid å tenke ut eksempler på, tilfeller der det vil være naturlig å bruke "det bysantinske rike" som en slags beskrivelse eller substantivfrase - og jeg vil anta at i det vil være mest naturlig å bruke uttrykk som "det bysantiske fremstøtet" eller "den bysantiske økonomien".

Denne problematikken var noe jeg måtte tenke grundig gjennom med for eksempel uttrykket "den internasjonale romstasjonen". Mener man den romstasjonen som faktisk heter "Den internasjonale romstasjonen" (egennavn) eller beskriver man bare at det er en internasjonal romstasjon ("De to amerikanerne X og Y var de første som sendt til den internasjonale romstasjonen, ISS" - hvor den internasjonale romstasjonen beskriver hva ISS er... hvis du skjønner problematikken) .

Så... for å si det sånn... hvis du eller noen har eksempler på setninger som kan ha denne tvetydigheten når det gjelder "Det bysantinske rike", "Det osmanske rike" eller "Det romerske rike", så må jeg selvfølgelig se litt på om jeg har gjort noe jeg ikke skulle gjøre... Men, ja... denne problematikken har vært i tankene mine.

TorbjørnS-AWB (diskusjonbidrag)

Slike tvetydigheter blir av og til noe som blir liggende i samme kategori som bokmål-/riksmåldebatten: Hva står skrevet, og hva mente man egentlig å si. Hvis en tekst i tillegg inneholder to/tre ulike skrivemåter av samme uttrykk så må man jo stille seg noen spørsmål... Når noen skriver for eksempel "Republikken Frankrike" i artikkelteksten så lurer jeg litt på om de faktisk mente å skrive det offisielle navnet på Frankrike, altså Republikken Frankrike, noe som rett og slett er ganske uvanlig å bruke i de fleste (uoffisielle) sammenhenger - eller mente man bare tilføye den informasjonen at Frankrike er en republikk, altså "republikken Frankrike". Siden man aldri helt vet hva som er opprinnelig tenkt vet man heller aldri helt hva som bør stå.

Sportsplassring vs klasseinndelig.

3
Sammendrag av TorbjørnS

Er klar over forskjellen

Aldebaran (diskusjonbidrag)

Det er forskjell på en idrettsutøvers førsteplass (1. -plass) og et skips/transportmiddels første plass (første plads) som tilsvarer første klasse. Håper du greier å skille mellom disse slik at du ikke introduserer feil i artiklene. (Og hvorfor kan jeg ikke få forhåndsvise innlegget mitt når jeg skriver på diskusjonssiden her?). Aldebaran (diskusjon) 15. okt. 2016 kl. 02:56 (CEST)

Telaneo (diskusjonbidrag)

Nederst i tekstboksen er det en linje som sier «og du kan forhåndsvise resultatet når som helst.» hvis du skriver i wikitekst. Trykk på «forhåndsvise resultatet» for å forhåndsvide det. Hvis du skriver med visualeditor vil innlegget se helt likt ut som du skriver det. Du kan bytte mellom wikitekst og visualeditor ved å trykke på klammeikonet nederst til høyre i tekstboksen.

TorbjørnS (diskusjonbidrag)

Ja, jeg regnet med at det var en forskjell, og da jeg støtte borti noen 1. plass i forbindelse med noe ang. hurtigruter klikket jeg bort retting av alle disse for sikkerhets skyld. Om det likevel skulle være noen tilfeller der jeg har oversett dette, er det bare å beklage. Desverre er det så mange -plassfikser at det er en viss mulighet for at jeg av ren uvane ikke alltid ser like nøye over akkurat disse, fordi det går litt automatikk i det også. Svaret på dette med forhåndsvisning vet jeg ikke.

Det finnes ingen eldre emner