[20] lgdt | 2005-05-21 13:10:48 |
angolul sajna nemtok elég jól ehhez. maradok a magyarnál, ahol a ragok is sokat segítenek.
|
|
|
[18] lgdt | 2005-05-21 09:27:53 |
Csináltam mondatértelmezőkét is. A bővítmény nélküli tagmondatokat, a "ha", a "vagy", az "és" és a "nem" szavakat képes megismerni.
input-output példák:
# ha esik az eső, akkor vizes az út
# az eső esik
az út vizes
---
# ha vizes az út, akkor esik az eső vagy locsolják
# az út vizes
az eső esik vagy locsolják
# az eső nem esik
locsolják
---
# ha a lámpa ég és megfelelő a páratartalom, akkor a lámpa látszik
# a lámpa nem látszik
a lámpa nem ég vagy a páratartalom nem megfelelő
# a páratartalom megfelelő
a lámpa nem ég
---
ezt még nem kapjátok meg. ötvözni akarom a ragozóval, a ragfelismerővel és a legújabb AI algommal. :D
meg azt akarom, hha talál magára vonatkozó utasítást a memóriában, akkor végrehajtsa (akár olyat is, ami arra vonatkozik, h h kell értelmezni a mondatokat).
amúgy már a mostani verzió is képes megoldani néhány köcsög matlog példát. :-D a következőt már az einsteini feladattal tesztelem. :-D
|
|
|
|
|
[14] lgdt | 2004-12-10 20:08:36 |
Ja igen, elfelejtettem leírni: a végső algo a matematikai logika szabályait fogja használni (egészen pontosan érvényben tartani). De ez még távoli cél. Majd később beszélünk róla, ha már nagyjából tudunk természetes mondatokat generálni formális állításokból.
|
|
[13] lgdt | 2004-12-10 19:59:33 |
Köszönöm a segítséget.
Kétféle hangzókiesést kezel: a -Vg-re végződő igéknél más szabályok érvényesek, mint az -ez végűeknél.
Egyelőre az -ez végűeket így szűri:
ha "e*ez"-re vagy "é*ez"-re végződő nem ikes igéknél esik ki az e, ahol a * helyén nem g és nem j áll.
Most azon gondolkozom, hogy könnyebb lenne minden, ha megismerné az igekötőket. Viszont ez főnévadatbázis nélkül sajnos nem lehetséges, így kénytelen vagyok egy csomó kivételes esetet beleépíteni a kódba (eddig kb. 20 van).
Ezt a php oldalt elsősorban azért csináltam, hogy az így kialakuló szabályrendszer jó heurisztika legyen a végső algo-nak, ami "magától" tanul beszélni. Persze az is lehetséges, hogy a "hardwired" szabályok is alkalmasak valami primitív chatbot elkészítéséhez.
|
|
[12] Hajba Károly | 2004-12-10 01:19:05 |
Kedves lgdt!
Néhány észrevétel a rutinodhoz:
A második szakaszt bátran nevezd mediális párnak, mivel többféle értelemben is használatos és ez a szakkifejezése. Gyakorlatilag a -(V)dik képző segítségével a korábbi tárgyat alanyi helyzetbe hozzod és a vmitől/valami által vonzatott kapja, de ez nem feltétlen önmagára utalást jelent.
Tájékoztatási jelleggel tájékoztatlak, hogy tájnyelvi környezetben létezik még egy igenévi alak, ez pedig az igei igenév. Ezt a formulát múltidejű állapotban (brahiból :o) rendszeresen használom a neten. Eddig még senki nem kérdezett vissza, hogy mi bajom van, pedig az irodalmi nyelvhasználat nem ismeri. Gyakorlatilag a tárgyas ragozási sorral egyezik meg. Pl. Az általam lefutott táv. ==> Lefutottam táv. Tömörebb szerkezet.
Néhány -(e)z képzőjű igénél kiesik az e hang, de mintha a Te példáidban olyankor is kiesik, mikor nem kellene. Ezt az esetet, hogyan kezeli a rutinod?
A hangugrató eseteket gyűjtöm, hogy valami szabályosságot lehessen kialakítani. Mindettől függetlenül gyanítom, hogy egy kivétellistát kell képezni. Sajnos itt a Word helyesírás ellenőrzője nem segít, mivel minden nem kieső alakot - egy kivételével - átenged. (*érezett - érzett, de érezek - érzek) Feltehetően itt már a jelentéshasadás esetével találkozunk. Furcsán hangzik, de elvileg nem hibás a szerezett alak a szerzett-tel szemben. Az előbbi: egy szerrel csinálni valamit, míg az utóbbi: (meg)szerezni egy dolgot. S mindkettőnek azonos az alapigéje: szerezni. Ezen kettős alakok miatt elég nehéz lesz a paradigmasorokat kitalálni.
Továbbra is javaslom Neked az említettem szakkönyv beszerzését.
Üdv: HK
|
Előzmény: [11] lgdt, 2004-12-09 16:03:59 |
|
[11] lgdt | 2004-12-09 16:03:59 |
Köszönöm a hozzászólásokat. Az oldalt fejlesztettem.
A hangrend szerinti illeszkedés szabálya kevés igére mondja meg, hogy végül milyen ragot kap, és azok jelentős részénél is rosszul.
a legtöbb ige az utolsó magánhangzója szerint 3 kategóriába sorolható:
1. aáoóuúií 2. oőüű 3. eé
kategóriaszám szerint E/1-ben pl. (1-o 2-ö 3-e)+k ragot kap az ige.
ez akkor nem érvényes, ha az ige tövének utolsó magánhangzója "i" vagy í, ekkor az utolsó előtti magánhangzó dominál, de a 2. kategória kiesik. ha egyszótagú az igető, akkor az 1.-es kategória lép életbe, kivétel: "csíp" és "int".
szerintem valami ilyesmi lehet az é-re végződő főneveknél is.
|
|
[10] Hajba Károly | 2004-12-06 23:38:37 |
Kedves Géza és lgdt!
Alább egy kicsit bővebben kifejtem a felmerült érdekes és kivételes ragozású szavak eredetét. Nem öncélúan teszem, hanem egyrészről érdekesség gyanánt; másrészről lgdt részére bemutatandó, hogy a kivételek nem véletlenszerűen adódnak, alakulnak ki, hanem sok törvényszerűség tapasztalható bennük, csak ez a nyelvfejlődés során alakul ki. Elméletileg ezek egy tekintélyes részét is meg lehet fogni valamely szabályosság leírásával. S már meg is érkeztünk a matematikai nyelvészet határmezsgyéjéhez. (Már csak, hogy ne legyünk OFF-ok :o)
A derék szavunk az etimológiai szótárak szerint egy nagyon korai szláv átvétel lehet dreku formában, ahol a szótag domináns magánhangzója egy a mainál hátrább képzett e hang lett, míg akkor a szóvégén nem lehetett csak magánhangzó, így oda kapott egy u félhangzót. Ezen félhangzóból ered a közbülső képzési helyű a toldalékhang. (S ezen félhang fejleményeként jelenik meg a kapu, gyalu, falu, apu ... szavainkban, továbbá sok ragozási sorban megjelenő -v- toldalékhangban. hó-havas, lő-lövök)
Az ómagyar nyelv a szóeleji mássalhangzó-torlódást sem tűrte el, ezért a dr közé valamely magánhangzó ékelődött be tájnyelvtől függően. ( > dVreku) Ezek közül az e-s változat győzött az irodalmi nyelvváltozat kialakulása során.
Az e>é átmenet egy középkorban létrejött nyelvfejlődési hatás eredményezi, mely sok alapszó utolsó rövid magánhangzóját megnyújtotta. Lásd: veréb-verebek, tehén-tehenek, darázs-darazsak, ...
A héj szavunk a haj ikerszava és ősi finnugor eredetű. Feltehetően a korábbról kimutatható ikerpárból szóhasadással jött létre, a magánhangzó helyén szélesebb skálájú hang állhatott.A két szélső hangot márjól meg lehetett különböztetni.Erre jött ráegy jelentésbővülés, mely a két hangváltozatnak más és más jelentést adott. Így szép lassan elváltak, de a ragozási soruk nem változott.
A cél szavunk valóban német eredetű, ahogy már Géza is jelezte. Itt egy mélyebb azaz hátrább képzett i-vel került át a nyelvünkbe. Középnémet régies zel, felnémet régies zil alakok átvétele a lovagi játékok átvétele során, mint szakszó. Mivel a magyar nyelv rendhagyó ragozásából következtetni lehet az átvett szó korabeli hangállapotára, a német etimológia akár figyelembe is veheti a Ziel szavuk korai hangállapotának kiderítése során, mint megerősítés.
A fenti példákból láthatjuk, hogy a rendhagyó állapotoknak nyelvtörténeti eredetük van és ezek leírható szabályszerűségek: kötelezőszóvégi magánhagzó ill. szóeleji magánhangzó-torlódás tilalma az ómagyar korban; megszünő és változó hangók; alapszó végi magánhangzó nyúlás, szóhasadás toldaléksor megtartásával, ...
HK
|
Előzmény: [9] Kós Géza, 2004-12-06 18:21:24 |
|
|
[8] Hajba Károly | 2004-12-06 12:35:53 |
Kedves lgdt!
Néhány észrevétel a rutinoddal kapcsolatban:
-Gondolom nem lep meg, hogy a magánhangzóra végződő igéket és sok egyéb képzővel már ellátott igéket nem képzi helyesen;
-Látom beleépítetted a -Vg végű igéket is, de nem mind egy kaptafára ragozódik. Hibák: farag, ballag, kullog
Egyelőre ennyit találtam.
HK
|
Előzmény: [1] lgdt, 2004-12-04 12:53:03 |
|
|
|
[5] Hajba Károly | 2004-12-06 10:27:35 |
Kedves Géza!
Az e, é hangzók körében csak egy példa ugrott most be: cél - célok, de a szintén magas hangrendű í-s szavak körében sok van, mely hangrendileg nem illeszkedik:
sír - sírok, síp - sípok, híd - hidak, sík - síkok, sír - sírok, bír - birok, fing - fingok (elnézést, de hát ez is a magyar nyelv része és ide tartozik :o)
De kiváncsi vagyok a másik két példádra.
A fenti példák, és feltehetően a tieid is egy ómagyar alsó-közép magasságú (közbülső elölségű, velár-centrális) ü-re (orosz jer ü) vezethető vissza, mely hang idővel magasabban (elülsőbben) képződött és összeolvadt az é ill. í hangokkal, de képzőik maradtak az eredeti pozicióban.
(Csak érdekesség gyanánt: A mai szakirodalom már elülső, közbülső és hátsó elölségű magánhangzót említ a magas ill. mély helyett, mivel ez pontosabban írja le a nyelvállást. A régi leírás artikuláció szempontjából indokolatlan, habár szép metafora és szubjektíven meg is állja a helyét.)
HK
|
Előzmény: [4] Kós Géza, 2004-12-06 09:29:37 |
|
[4] Kós Géza | 2004-12-06 09:29:37 |
Sziasztok,
Én jobban szeretem a meglepő kivételeket gyűjteni.
A kedvenc példám:
Az e és az é magánhangzó mindig magas, és ha egy szó csak ezeket a magánhangzókat tartalmazza, akkor magas hangrendű ragokat kap. Kivéve ...
Három kivételt ismerek, de biztosan van több is.
Üdv.
Géza
|
|
[3] Hajba Károly | 2004-12-06 00:50:32 |
Kedves lgdt!
Örülök, hogy a nyitottam téma (M és Ny) egy részterületével újabb topikot nyitottál. Ez azt jelenti, hogy többen érdeklődést mutatnak a téma iránt.
Nos amiről írsz, jóval tágabb vonatkozásban már eléggé alaposan fel van dolgozva és a műhely, ahol ezzel foglalkoznak a MTA Nyelvtudományi Intézete. Gyakorlatilag ez a feladatuk. :o) Ennek jelen eredményeként 2000-ben megjelentették a többkötetes Strukturális Magyar Nyelvtan című kiadványt, melynek közel 1100 oldalas 3. Morfológia kötetében van az érdekelted téma (igaragozás) is leírva. A kötet közismertebb szerzői: Kiefer Ferenc, Pléh Csaba és Prószéki Gábor (Morphologic).
Az általános igeragozás személyragjainak összevont jelen idejű alakjai:
Egyes szám |
Első személy: |
-Vk |
Második személy: |
-(A)sz, -Vl |
Harmadik személy: |
-Ø |
Többes szám: |
Első személy: |
-Unk |
Második személy: |
-(V)tVk |
Harmadik személy: |
(A)nAk |
|
Ennek értelmezése során ismerni kell a fonológiai alapvető jelőlési rendszert. V - általános magánhangzó (vokális), U - [u, ü] hangok, A - [a, e] hangok, (A) - az A hang zérussal alternál azaz el is tünhet, Ø - üres hang helye.
Az E/2-ben pl. egyes tájnyelvek szavai -sz helyett -l ragot is kaphatnak (futol, mondol, ...)
A konkrét rag formájára realizációs szabályok léteznek. Itt figyelembe veszik az ige szabályosságát vagy lexikai egységét, idejét, számát, személyét, tárgyasságát, módját; továbbá létezik egy illeszkedési szabály a magánhangzók illeszkedésére. Gyakorlatilag Te egy ehhez hasonló, de csökkentett tudású kis rutint írtál.
A rendhagyó ragozási sorokat is meg lehetne ragadni, csak ahhoz nyelvtörténeti törvényszerűségekre is figyelni kell. A rendhagyó sorok struktúrájával már nem foglalkozik a fenti mű. Ez egy keményebb dió lehet.
HK
|
Előzmény: [1] lgdt, 2004-12-04 12:53:03 |
|
[2] lgdt | 2004-12-04 12:55:26 |
sorry, nem gontoltam, hogy ez a TeX elrontja a királyul megformázott szövegemet. azért nagyjából lehet érteni.
|
|
[1] lgdt | 2004-12-04 12:53:03 |
A magyar nyelvben szeretnék olyan formális szabályokat találni, amelyek alól kevés a kivétel. Ehhez kérek Tőletek segítséget.
Az igeragozással már foglalkoztam, írok egy példát:
Jelen idő, alanyi ragozás az igéket 3 kategóriába soroltam (ezentúl igének hívom az ige E/3 alakját "ik" nélkül)
ha "ít"-re vagy "iz"-re végződik, akkor az utolsó előtti magánhangzó szerint az ige: "aáoóuúií" esetén: 1-es kategóriájú "öőüűeé" esetén: 3-es kategóriájú
egyébként az utolsó magánhangzó szerint: "aáoóuúií" esetén: 1-es kategóriájú "öőüű" esetén: 2-es kategóriájú "eé" esetén: 3-mas kategóriájú
E/1 1. ha az ige magánhangzóra végződik, akkor "v"-t kell mögé fűzni 2. a következő betű az ige kategóriája szerint: 1: "o" 2: "ö" 3: "e" 3. a rag utolsó betűje mindig "k"
E/2: 1. ha az ige magánhangzóra végződik, akkor "v"-t kell mögé fűzni 2. ha "z"-re végződik, akkor a toldalék kategória szerint 1: "o" 2: "ö" 3: "e", majd "l" 3. ha "ít"-re végződik, vagy dupla mássalhangzóra, akkor a toldalék kategória szerint 1: "a" 2: "e" 3: "e", majd "sz" 4. ha bármi másra végződik, akkor a toldalék "sz"
E/3 1. ha ikes ige, akkor a toldalék: "ik"
T/1 1. ha az ige magánhangzóra végződik, akkor "v"-t kell mögé fűzni 2. a következő betű az ige kategóriája szerint: 1: "u" 2: "ü" 3: "ü" 3. a rag utolsó 2 betűje mindig "nk"
stb...
A fenti rendszer alól kivétel pl. a "van", "jön", "megy" és a "szerez" ige.
Tudtok ilyen konkrét leírásokat?
Írni fogok programot, ami toldalékolt szavakat, szószerkezeteket, majd mondatokat generál adott séma szerint. Szerintetek jó ötlet? Lehetséges? Segítetek a tesztelésben, a szabályok és kivételek felfedezésében, és esetleg a fejlesztésben?
A fenti szabályt itt lehet próbálgatni.
|
|