Hoppa till innehållet

Diakritiskt tecken

Från Wikipedia

Diakritiska tecken (från grekiskans diakritikoʹs - "som åtskiljer"[1]) är små skrivtecken som läggs till en bokstav (över, under eller ovanpå) som har en särskiljande funktion (det vill säga bokstavens uttal ändras). I många språk finns det bokstäver med vad som ser ut som diakritiska tecken, men som formellt räknas som egna bokstäver, som svenska å, ä och ö.

I vid mening

[redigera | redigera wikitext]

Ibland talar man om diakritiska tecken i en vidare mening och räknar ändå in de bokstäver (såsom svenska å, ä, ö) som formellt räknas som egna bokstäver och dessutom apostrofen (’ eller '), accenter och skiljetecken.[1] Detta gör man till exempel i sammanhang då man diskuterar stavning av utländska ord eller tekniska lösningar utan att vilja komma in på (eller känna till) teknikaliteter om hur symbolen räknas i respektive språk.

Ringen i å och prickarna i ä och ö kan i vid mening räknas som diakritiska tecken över bokstäverna a respektive o[1], vilket tyskar anser om tecknen ü, ä och ö. Anledningen till att man inte har den synen i svenska är att dessa ljud historiskt inte har representeras av diakritiska tecken utan av egna bokstäver som det fortfarande gör hos norska och danska æ och ø. De germanska språken har ljud som inte finns i de romanska och när man övergick från runskrift till det latinska alfabetet lade man i fornnordiska och fornengelska till bokstäverna æ och œ, medan fornhögtyska använde diakritiska tecken på a och e så de blev ä och ö. I samband med införandet av boktryckarkonsten upphörde användningen av æ och œ i engelska, och det första tryckta verket som fick större spridning i Sverige var Gustav Vasas bibel där æ och œ ersatts med ä och ö. Anledningen var dels att bibeln översatts från tyska, dels att Gustav Vasa ville markera Sverige som ett eget land efter upplösningen av Kalmarunionen.

I det svenska språket används inte diakritiska tecken särskilt ofta, men förekommer i tecknet é, till exempel i idé och armé, och en del lånord.

I andra språk

[redigera | redigera wikitext]

I språk som franska har man diakritiska tecken som kallas accenter. I andra språk som exempelvis tyska räknas tecken som ä/ö/ü som självständiga bokstäver även om de i till exempel sortering hanteras som varianter av a/o/u.

Även språk med andra alfabet än latinska alfabetet kan ha diakritiska tecken, till exempel grekiska. Ryska och andra språk med kyrilliska alfabetet har självständiga bokstäver med vad som ser ut som diakritiska tecken (й, ё, ђ, ѓ, ї, ћ, ќ, ў, ґ, ғ)

I konsonantalfabet, abjader, som till exempel arabiska och hebreiska så används diakritiska tecken för att markera när en konsonant följs av en kort vokal. I arabiskan finns också en rad diakritiska tecken som förändrar både ett ords uttal och dess grammattiska funktion. Dessa så kallade harakãt placeras ovanför eller under en bokstav. De används dock bara i undantagsfall i vardaglig skrift.

Lista över diakritiska tecken till latinska bokstäver

[redigera | redigera wikitext]

Här listas de efter utseende, och denna lista avser endast de som används med latinska tecken. De kallas ofta helt olika saker i olika språk, och ses ofta inte som diakritiska tecken.

Tecken Namn Används i följande språk Förklaring / Exempel
á, é, ć, í, ĺ, ń, ó, ŕ, ś, ú, ý, ź akut accent franska, isländska, polska, portugisiska, spanska, danska, norska, tjeckiska, slovakiska m.fl. É markerar i svenskan (endast lånord) betoning på stavelsen ifråga, som i armé. Á uttalas /aʊ/isländska. Danska och norska kan ha ´ över särskilt betonade vokaler, såsom i räkneordet én, till skillnad från obestämda artikeln en.
ő, ű dubbel akut accent ungerska Markerar lång version av bokstäver med trema (ö, ü).
à, è, ì, ò, ù grav accent franska, portugisiska, italienska m.fl. Markerar i franskan att 'e' ska uttalas /ɛ/, samt innehar en grammatisk funktion på 'a' och 'u'.
ä, ë, ï, ö, ü, ÿ trema franska, tyska, nederländska, isländska, svenska, spanska, turkiska m.fl. Markerar i franskan m.fl. dieresis, det vill säga att två bredvid varandra stående vokaler skall uttalas separat, ej som ett gemensamt ljud, till exempel i franskan Citroën, Noël, Anaïs. Markerar i tyskan ett särskilt uttal orsakat av en historisk assimilationsprocess.
â, ĉ, ê, ĝ, ĥ, î, ĵ, ô, ŝ, û, ŷ cirkumflex franska, portugisiska, esperanto, kurmanji, m.fl. I franskan en rest av ett bortfallet -s-
ã, ñ, ĩ, õ, ũ tilde spanska, portugisiska, bretonska, estniska m. fl. Markerar i spanskan att "n" ska uttalas "nj" som i señor (muljering). Markerar i diverse språk nasal vokal. I estniskan symboliserar õ ljudet /ɤ/.
ç, ḑ, ķ, ļ, ņ, ŗ, ş, ţ cedilj franska, portugisiska, katalanska, lettiska, liviska, turkiska m.fl. Markerar i franska och portugisiska att "c" ska uttalas "s" före hård vokal, som i portugisiska Moçambique. Ş uttalas sch i turkiska. I vissa centraleuropeiska språk används cediljer som inte "sitter fast" på bokstaven. I liviskan står bokstaven ḑ för ljudet /ɟ/.
ģ cedilj över lettiska I lettiska har man ģ men dess motsvarande stora bokstav skrivs Ģ. En cedilj under g passar inte bra typografiskt, så den placeras över istället. Ģ uttalas /ɟ/.
ș, ț komma rumänska

rumänska vill man ha s och t med komma under för typografisk korrekthet, men man har accepterat ş och ţ (med cedilj) i datorer (och datorutskrifter) eftersom det är vad som stöddes. Skillnaden är liten och ingen risk för missförstånd. Rumänskt typsnitt kan ge rumänskt utseende på Ş. Ş kommer från turkiska, ett traditionellt inte så populärt land hos rumäner.

ǎ, č, ě, ǐ, ň, ǒ, ř, š, ǔ, ž hake tjeckiska, kroatiska, serbiska, litauiska, slovakiska, pinyin, lakota m.fl. tjeckiska uttalas c som ts (ts) medan č låter som ett t följt av en tonlös postalveolar frikativa (); s är ett rent s (s) medan š är en tonlös postalveolar frikativa (ʃ). Exempel på detta är Česká republika och Škoda. Markerar i pinyin fallande-stigande tonfall.
ą, ę, į, ų svans litauiska, polska Markerar i polskan att en vokal ska uttalas nasalt. Kallas också ogonek.
ă, ğ, ĭ, ŭ brevis rumänska, turkiska m.fl. Markerar i rumänskan att "ă" ska uttalas /ə/ (schwa).
ā, ē, ī, ō, ū, ǖ streck ovanför (macron) lettiska, liviska, pinyin, rōmaji Markerar i lettiskan lång vokal, som i Rīga. Markerar i pinyin högt rakt tonfall, och i rōmaji lång vokal. I äldre svenska handskrifter har macron använts över enkel bokstav som ett förkortat skrivsätt för dubblerad bokstav, exempelvis i varumärket Gyllenhammars havremust. Vid telegrafimottagning med manuell nedskrift används macron i tidsbesparande syfte som substitut för dieresis vid Ä och Ö.
ċ, ė, i, ġ, ż punkt litauiska, polska, turkiska, maltesiska. I turkiska är İi vanligt /i/ och Iı /ɯ/.
å, ů ring svenska, danska, norska, vallonska, tjeckiska Markerar i tjeckiskan långt /u/.
ď, ľ, ť apostrof tjeckiska, slovakiska Dessa apostrofer "sitter ihop" med bokstaven, och är egentligen en hake i stil med č och ě, fast haken får inte plats. Att skriva med lös apostrof d', l', t' är fel. Apostrofen visar att bokstaven är muljerande.
ø, ł snedstreck danska, norska, färöiska, polska Snedstrecket sitter tvärs över bokstaven. I polska uttalas Łł som engelskans /w/.
đ, ħ, ŧ vågrätt streck ovanpå samiska, maltesiska, kroatiska, bosniska, serbiska I serbiska, kroatiska och bosniska står đ för d+j. Maltesiskans ħ är en tonlös faryngal frikativa.
många, till exempel ẻ,ế,ệ,ễ vietnamesiska I vietnamesiska används latinska alfabetet med en rik flora diakritiska tecken, ofta två per bokstav. De markerar tonfall och liknande som är betydelseskiljande på vietnamesiska. I Unicode har man ett tecken per kombination, såsom för europeiska språk, fast det finns fler än 200 kombinationer unika för vietnamesiska.
fler Det finns fler diakritiska tecken som används i mindre språk, oftast utanför Europa.

Att generera tecknen

[redigera | redigera wikitext]

Enligt finländsk mångspråkig tangentbordsuppsättning finns akut, grav och cirkumflex accent direkt tillgängliga, medan tilde, háček och mer ovanliga diakriter fås fram med Alt Gr-tangenten kombinerad med olika tangenter till höger på tangentbordet (t.ex. š fås som AltGr-* s). Tangentkombinationen trycks innan tangenten för det tecken diakriten skall kombineras med.

Med Compose-tangenten, vanlig t.ex. på tangentbord för Linux, kan man åstadkomma de kombinerade tecknen genom olika tangentkombinationer, en del ad hoc, en del mer systematiska. T.ex. kan cedilj eller komma under ett tecken skrivas som Compose c c (ç) respektive Compose , t (ț) eller liknande.

Tecken stödda i Unicode

[redigera | redigera wikitext]

Latinska bokstäver med diakritiska tecken:

U+00C0: ÀÁÂÃÄÅÇÈÉÊËÌÍÎÏÑÒÓÔÕÖØÙÚÛÜÝ
U+00E0: àáâãäåçèéêëìíîïñòóôõöøùúûüýÿ
U+0100: ĀāĂ㥹ĆćĈĉĊċČčĎďĐđĒēĔĕĖėĘęĚěĜĝĞğĠġĢģĤĥĦħĨĩĪīĬĭĮįİĴĵĶķĹĺĻ
U+0140: ļĽľĿŀŁłŃńŅņŇňʼnŌōŎŏŐőŔŕŖŗŘřŚśŜŝŞşŠšŢţŤťŦŧŨũŪūŬŭŮůŰűŲųŴŵŶŷŸŹźŻżŽŽ
U+0180: ƂƃƇƈƋƌƑƒƓƘƙƝƠơƣƤƥƨƫƬƭƮƯưƳƴƵƶ
U+01C0: ǍǎǏǐǑǒǓǔǕǖǗǘǙǚǛǜǝǞǟǠǡǤǥǦǧǨǩǪǫǬǭǰǴǵǸǹǺǻǾǿ
U+0200: ȀȁȂȃȄȅȆȇȈȉȊȋȌȍȎȏȐȑȒȓȔȕȖȗȘșȚțȞȟȤȥȦȧȨȩȪȫȬȭȮȯȰȱȲȳ
U+1E00: ḀḁḂḃḄḅḆḇḈḉḊḋḌḍḎḏḐḑḒḓḔḕḖḗḘḙḚḛḜḝḞḟḠḡḢḣḤḥḦḧḨḩḪḫḬḭḮḯḰḱḲḳḴḵḶḷḸḹḺḻḼḽḾḿ
U+1E40: ṀṁṂṃṄṅṆṇṈṉṊṋṌṍṎṏṐṑṒṓṔṕṖṗṘṙṚṛṜṝṞṟṠṡṢṣṤṥṦṧṨṩṪṫṬṭṮṯṰṱṲṳṴṵṶṷṸṹṺṻṼṽṾṿ
U+1E80: ẀẁẂẃẄẅẆẇẈẉẊẋẌẍẎẏẐẑẒẓẔẕẖẗẘẙẚẠạẢảẤấẦầẨẩẪẫẬậẮắẰằẲẳẴẵẶặẸẹẺẻẼẽẾế
U+1EC0: ỀềỂểỄễỆệỈỉỊịỌọỎỏỐốỒồỔổỖỗỘộỚớỜờỞởỠỡỢợỤụỦủỨứỪừỬửỮữỰựỲỳỴỵỶỷỸỹ

Grekiska bokstäver med diakritiska tecken:

U+0380: ΆΈΉΊΌΎΏΐΪΫάέήίΰϊϋόύώ

Kyrilliska bokstäver med diakritiska tecken:

U+0400: ЀЁЂЃЇЌЍЎЙйѐёђѓїќѝўѢѣѯѶѷѼѽѾѿҎҏҐґҒғҙӂӑӓӗӝӟӣӥ

Arabiska bokstäver med diakritiska tecken:

U+0621: آ أ ؤ إ ئ ب ة ت ث ج ح خ د ذ ز ش ض ظ غ ف ق ك ن ي