تعليم:ڪاليج ۽ يونيورسٽيون

ڪورپس لسانيات ڇا آهي؟

ڪجھه ڏهاڪن اڳ، سائنسدان صرف لسانياتي تحقيقاتي خودڪار ڪرڻ جا خواب ڳولي سگهن ٿا. اهو ڪم هٿيار طور تي ڪيو ويو، شاگردن جي وڏي تعداد ۾ ان ۾ ملوث هئا، "خرابيء جي ڪري" غلطي جو هڪ اهم امڪان هو، ۽ سڀ کان اهم طور تي - اهو تمام گهڻو وقت گذريو آهي.

ڪمپيوٽر جي ٽيڪنالاجي جي ترقي سان، اهو ممڪن آهي ته مطالعي جي لحاظ کان تيز رفتار جو حڪم جاري ڪن، ۽ اڄ هڪ زبان جي مطالعي ۾ سڀ کان وڏو حوصلو شعور لسانيات آهي. ان جي خاص خصوصيت متن جي معلومات جي وڏي مقدار جو استعمال آهي، هڪ واحد ڊيٽابيس ۾ گڏيل طور تي، خاص طور تي نشان لڳايو ويو ۽ جسم جو نالو.

اڄ تائين، ڪيتريون ئي عمارتون آهن جن ۾ مختلف عمارتون پيدا ڪيون ويون آهن، مختلف بنيادن جي بنيادن تي، لکن کان ڏهه بلين تائين ليڪسيل يونٽ کان. اها هدايتن جي تشخيص جي طور تي تسليم ڪيو ويو آهي ۽ درخواست ۽ تحقيق جي مقصدن حاصل ڪرڻ ۾ اهم ترقي جو مظاهرو ڪيو ويو آهي. ماهرن جو ڪنهن به قدرتي ٻولي سان معاملو آهي، اها صلاح ڏني وئي آهي ته توهان پنهنجن مقصدن جي گهٽتائي سان، گهٽ ۾ گهٽ بنيادي سطح تي واقف آهيو.

ڪورپس لسانيات جي تاريخ

هن هدايت جي ٺهڻ سان 1960 ع جي شروعات ۾ برون ڪورپس جي آمريڪا جي پيدائش سان لاڳاپيل آهي. نصوص جو مجموعو فقط 1 ملين لفظ فارمن تي مشتمل آهي، ۽ اڄ به اهڙي حجم جي ڪور مڪمل طور تي غير مناسب ٿي سگهندو. وڏي حد تائين، هي ڪمپيوٽر ٽيڪنالاجيز جي رفتار جي رفتار، ۽ نئين تحقيق جي وسيلن جي وڌندڙ مطالبن جي سبب آهي.

1990 ع ۾ ڪورپس جو لسانيات هڪ مڪمل ۽ آزاد نظم ۾ ٺاهيو ويو هو، نسخن جي گڏجاڻين ۽ ڪيترن ئي درجن ٻولين جي حوالي ڪيو ويو. مثال طور، هن دور ۾، برطانوي نيشنل ڪور 100 ملين استعمال لاء پيدا ٿيو.

جئين لسانيات جي ترقي جي هن حد تائين، مضمونن جي مقدار ۾ تمام گهڻو ٿي ويا (۽ اربين الفاظ لفظ يونٽ تائين پهچي وڃن)، ۽ مارڪپ موڙي وڌيڪ ۽ وڌيڪ مختلف قسم جي آهي. اڄ، انٽرنيٽ جي اسپاني ۾، توهان لکت ۽ تقرير تقرير، ڪيسن ۽ تدريس جو ڪيس ڳولي سگهو ٿا، فنڪشنل يا تعليمي ادب تي مبني طور تي ڪيترن ئي ٻين قسمن جي.

جسم ڇا آهي

کابين لسانيات ۾ ڪيسن جا قسم ڪيترن ئي سببن لاء پيش ڪيا وڃن ٿا. اهو واضح طور تي واضح آهي ته طبقاتي بندي جي بنياد نصوص جي ٻولي (روسي، جرمن)، رسائي جو طريقو (اوپن سرچ، بند ۽ تجارتي) جي مواد جي مواد، افسانه، دستاويزي، تعليمي، صحافت).

هڪ دلچسپ طريقو آهي زبان جي نسل زباني تقرير جي نمائندگي ڪندڙ آهي. اهڙي طرح جي تقرير جي رڪارڊ کان وٺي جوابدارن جي لاء مصنوعي حالت پيدا ڪندو هوس ۽ نتيجو ڪندڙ مواد "مظاهرو" نه ٿي سگهيو، جديد ڪورپس لسانيات جي هڪ مختلف طريقي سان ورتي. رضاکار مائڪروفون سان گڏ آهي، ۽ ڏينهن ۾، سڀئي گفتگو جيڪي هن ۾ حصو وٺندا آهن. عام طور تي، ماڻهن کي هن ڪچهري جي ترقي ۾ حصو وٺڻ واري ڪچهري دوران خبر ناهي.

بعد ۾، وصول ٿيل آڊيو رڪارڊ ڊيسٽيسٽ ۾ ذخيرو ٿيل آهن ۽ نقل سان لکت واري قسم جي مطابق ڇپيل متن سان گڏ آهن. ان ڪري، زباني روزمره جي تقرير جي جسم کي ٺاهڻ لاء مارڪ اپ ضروري آهي.

درخواست

جتي ٻولي جو استعمال ممڪن آهي، اهو پڻ متن بڪ استعمال ڪرڻ ممڪن آهي. لسانيات ۾ سوراخ طريقا لاڳو ڪرڻ جو مقصد هن ريت ٿي سگهي ٿو:

  • سرون لڳائڻ جي پروگرامن جو پروگرام فعال طور تي سياست ۽ ڪاروبار ۾ استعمال ڪيو ويو جيڪو مثبت ۽ منفي موٽندڙ ووٽرن ۽ گراهڪن کان، ترتيب سان.
  • انهن جي ڪارڪردگي کي بهتر ڪرڻ لاء لغات ۽ مترجمن کي معلوماتي سسٽم ملائڻ.
  • مختلف قسم جي تحقيقي ڪمن جيڪي ٻوليء جي جوڙجڪ کي سمجهڻ ۾، انهي جي ترقي ۽ مستقبل جي ويجهو تبديليء جي تاريخ جي تاريخ ۾ حصو وٺندا آهن.
  • morphological، syntactic، semantic ۽ ٻين خاصيتن جي بنياد تي معلومات حاصل ڪرڻ واري نظام جي ترقي.
  • مختلف لسانياتي نظام جي ڪم کي بهتر ڪرڻ

گھر جون شيون استعمال ڪريو

وسائل انفارميشن هڪ عام سرچ انجن سان ملندڙ آهي ۽ प्रयोगकर्तालाई केही शब्द प्रविष्ट गर्न वा सूचना जानकारीको माध्यमबाट खोज गर्न शब्दहरूको संयोजनलाई प्रोत्साहित गर्दछ. هڪ صحيح سوال جي فارم جي علاوه، توهان تقريبن ڪنهن به لسانياتي معيار لاء متن جي معلومات ڳولڻ جي اجازت ڏئي ٿي.

ڳولا لاء بنياد ٿي سگهي ٿو:

  • ھڪٻئي جي تقرير جي حصن واري ھڪڙي گروپ سان.
  • گراماتي نشانيون؛
  • سامتيڪ؛
  • مصنوعي ۽ جذباتي رنگ.

اضافي طور، توهان لفظن جي ترتيب جي ڳولا جي معيار کي گڏ ڪري سگهو ٿا: مثال طور، فعل جي سڀني واقعن کي موجوده زمانه ۾ ڳولڻ، پهرين شخص، واحد، بعد ۾ پيش ڪيل "ج" ۽ اسم جي الزام جي صورت ۾. اهڙي سادي ڪم جو حل صارف لاء ڪجھ سيڪنڊن کي پورو ڪري ٿو ۽ مخصوص فيلڊ ۾ صرف چند ڪلڪن جي ضرورت آهي.

ٺاهڻ جي عمل

ڳولا پاڻ کي سڀني سبڪڙپس تي، ۽ هڪ خاص طور تي چونڊيو وڃي ٿو، خاص مقصد حاصل ڪرڻ جي ضرورتن جي بنياد تي ڪري سگهجي ٿو.

  1. سڀ کان پهريان، اهو طئي ڪيو وڃي ٿو ته نصوص ڪيس جو بنياد بڻجي ويندا. عملي مقصدن لاء، اڪثر صحافي، اخباراتي مواد، آن لائين تبصرو استعمال ڪيو ويو آهي. تحقيقاتي منصوبن ۾، مختلف قسم جا ملفوظات استعمال ڪيا ويندا آهن، پر انهن لکڻين کي ڪجهه عام زمين جي مطابق چونڊيو وڃي ٿو.
  2. نصوص جو نتيجو سيٽ اڳوڻي پروسيسنگ کي ختم ڪري ٿو، غلطيون صحيح آهن، جيڪڏهن دستياب، بائبل جي هڪ لائبريري ۽ اضافي لساني وضاحت تيار ڪئي وئي آهي.
  3. سڀ غير متن واري ڄاڻ صاف ڪئي وئي آهي: گرافڪس، تصويرون، ٽيبل ختم ٿي وڃن ٿيون.
  4. انهن جي وڌيڪ پروسيسنگ لاء، عام طور تي لفظن جي نمائندگي ڪرڻ وارن آهن.
  5. آخرڪار، نفسياتي، نحو ۽ ٻين نشانين جي نتيجي ۾ عناصر جو نتيجو مقرر ٿيو آهي.

سڀني عملن جي نتيجن کي هڪ نطرياتي جوڙجڪ جو نتيجو آهي، ان ۾ بيان ٿيل عناصر جو هڪ مقرر ڪيل سلسلو آهي، جنهن مان هر هڪ بيان جي حصي کي بيان ڪيو ويو آهي، گراماتياتي، ۽ ڪجهه حالتن ۾، بنيادي خصوصيتن.

ڪورز جي ميدان ۾ ڏکيا

اهو سمجهڻ ضروري آهي ته اهو ڪيس حاصل ڪرڻ لاء ڪافي لفظن يا جملن کي گڏ ڪرڻ لاء ڪافي ناهي. هڪ پاسي تي، متنن جي مجموعي متوازن هجڻ لازمي آهي، جيڪو ڪجهه حرفن ۾ متن جي مختلف قسمن جي نمائندگي ڪرڻ آهي. ٻئي طرف، معاملي جي مواد خاص طور تي نشان لڳل هجي.

پهريون سوال معاهدي ذريعي حل ڪيو ويو آهي مثال طور، فنن جو 60 سيڪڙو مضمون، دستاويزن جي 20 سيڪڙو شامل آهن، هڪ خاص تناسب، زباني تقرير، قانون سازي جي عملن، سائنسي ڪمن جي لکت جي نمائندگي کي ڏنو ويو آهي. وغيره هڪ متوازن جسم لاء مثالي طريقا موجود ناهي.

ٻيو سوال، مواد جي مارڪپ بابت، حل ڪرڻ ڏاڍو ڏکيو آهي. اهڙا خاص پروگرام آهن ۽ الورورڊس استعمال ڪيل لکن جي خودڪار مارڪ اپ لاء استعمال ڪيا ويا آهن، پر اهي 100 سيڪڙو نتيجو نه ڏيندا آهن، انهن کي ناڪام بنائڻ ۽ دستي نظرثاني جي ضرورت هوندي آهي. هن مسئلي کي حل ڪرڻ ۾ امڪاني ۽ مسئلن جو زورواروف ڪمپوس لسانيات جي ڪم ۾ تفصيل سان بيان ڪيو ويو آهي.

متن جي مارڪپ ڪيترن ئي سطحن تي ڪيا ويا آهن، جنهن کي اسين هيٺ ڏنل فهرست ڪنداسين.

مورتياتي ڇڪڻ

اسڪول جي بينچ مان اسان کي ياد آهي ته روسي ۾ تقرير جي مختلف حصن جا آهن، ۽ انهن مان هر هڪ پنهنجي خاصيتن جا آهن. مثال طور، فعل مزاج ۽ وقت جو زوال آهي جنهن جو اسم نگاه نه آهي. هاڻوڪي اسپيڪر اسمن کي رد ڪرڻ ۾ مشغول ناهي ۽ فعل کي منحصر ڪن ٿا، پر دستور مزدور اهو ڪيس 100 لک لفظن ۾ نشان هڻڻ لائق ناهي. جيتوڻيڪ سڀني ضروري عملن کي ڪمپيوٽر طرفان پيش ڪري سگهجي ٿو، تنهن هوندي به هن لاء سيکارڻ ضروري آهي.

مورفولوجي مارڪنگ کي ضروري آهي ته ڪمپيوٽر لاء "سمجهي" هر لفظ کي ڪجهه جماعتي خاصيتون هجڻ جي تقرير جي هڪ حصي جي طور تي. روسين ۾ ڪيترا ئي باقاعده ضابطا موجود آهن (جهڙوڪ ڪنهن ٻئي ٻوليء ۾)، اهو ممڪن آهي ته ميٽرولوجي تجزياتي لاء هڪ خودڪار طريقيڪار ٺاهڻ جي مشين ۾ ڪجهه الورورڊس کي سرمایہ ڪندي. بهرحال، ضابطن جا استثنا آهن، ۽ گڏوگڏ مختلف پيچيده ساز ڪارڪردگي. نتيجي طور، خالص ڪمپيوٽر تجزيي اڄ تائين مثالي کان پري آهي، ۽ جيتوڻيڪ 4٪ غلطي کي 4 لک لفظن کي في ايڪڙ 100 ملين يونٽ ڏئي ٿو، دستي نظرثاني جي ضرورت هوندي آهي.

تفصيل سان زڪواروف وي پي "ڪورپس لسانيات" جي بيان سان بيان ڪيو ويو آهي.

مصنوعي مارڪيٽ

ٻڪندڙ يا چرپرنگ اهو طريقو آهي جيڪو لفظن جي رشتي کي هڪ جملي ۾ بيان ڪري ٿو. الورورڊم جي هڪ سيٽ جي مدد سان، اهو متن، مضمون، اضافو، تقرير جي مختلف رخن ۾ بيان ڪرڻ ممڪن آهي. نتيجو اهو آهي ته ڪهڙو مثال ۾ ڪهڙا بنيادي آهن ۽ جيڪي ڀاڙين ٿا، اسان موثر طريقي سان معلومات کي متن کان ٻاهر ڪڍڻ ۽ مشين کي ٽريننگ ڪرڻ لاء صرف انهي معلومات کي استعمال ڪري سگهون ٿا جيڪي ڳولا جي سوال جي جواب ۾.

رستي جي ذريعي، جديد ڳولا انجين هن ترتيب جي سوالن جي جواب ۾ ڊگهو متن جي بدران مخصوص اندازن جي پيداوار لاء استعمال ڪندا آهن، جيئن "" سيپل ۾ ڪيترا क्यालोरीहरू "يا" मस्को देखि पीटर्सबर्गसम्मको दूरी ". بهرحال، بيان ڪيل عمل جي بلڪل بنيادي ڳالهين کي سمجهڻ لاء، توهان "پنهنجي ڪورپس لسانيات جي تعارف" يا ٻين بنيادي تعليم جي سهڪار سان پنهنجو پاڻ کي واقف ڪرڻ جي ضرورت پوندي.

سامونڊي نشان لڳل

لفظ جي صحيح معني، عام اصطلاحن ۾، ان جي معني. تجزياتي تجزيو ۾ وڏي پيماني تي قابل اطلاق نقطو لفظ کي لفظن سان منسوب ڪري ٿو، ان جي نموني جي هڪ سيٽ جون ترتيبون ۽ ضمني ڪاما جو ظاهر ڪن ٿا. هي ڄاڻ ڪورپس لسانيات جي طريقن کي استعمال ڪندي متن جي ٽينيت، خودڪار طريقيڪار ۽ ٻين ڪمن جي تجزيه لاء الورورڊس جي اصلاح لاء قيمتي آهي.

اتان جي وڻ جو هڪ انگ "جڙ" آهي، جيڪي خلاص لفظون آهن، جن کي تمام گهڻو جامع سيمينڪ آهي. جيئن ته هن وڻ جي شاخن ۾، خاص طور تي مخصوص ليکڪ عناصر شامل آهن جيڪي جوڙيندڙ آهن. مثال طور، لفظ "پئي" جهڙوڪ تصورات سان "من" ۽ "جانور" سان ڳنڍيل هجي. پهريون لفظ وڌيڪ جانورن جي مختلف قسمن، ڪائنات، قوميت، ۽ سيڪنڊن لاء طبقن جا طبقا ۽ نسلن جي قسمن ڏانهن ويندا.

معلومات جي بحالي واري نظام جي درخواست

ڪورپس لسانيات جي استعمال جي شعبي ۾ مختلف قسم جي سرگرمين جون قطارون شامل آهن. ڪيسن کي گڏ ڪرڻ ۽ درست ڪرڻ لاء استعمال ڪيو ويو آهي، خودڪار ترجمي واري نظام ٺاهڻ، خلاص ڪرڻ، حقيقتن کي ڪڍڻ، اهم ۽ ٻين لفظ پروسيسنگ کي طئي ڪرڻ.

ان کان سواء، اهڙي وسيلن کي دنيا جي ٻولين جي مطالعي ۽ مجموعي طور تي ٻوليء جي ڪم ڪرڻ واري ميلاث ۾ فعال طور تي استعمال ٿيل آهن. پري تيار ڪيل ڄاڻ جي وڏي مقدار تائين رسائي هڪ ٻولين جي ترقي ۽ رجحان جي جامع مطالعي کي سهولت جي ترقي، neologisms جي ٺهڻ ۽ مستحڪم تقرير جي مٽاسٽا، ليڪڪس يونٽس جي اقدار ۾ تبديلي،

ڊيٽا جي اهڙي وڏي مقدار سان ڪم ڪرڻ کان وٺي خودڪار، ضرورت آهي ڪمپيوٽر ۽ ڪورپوس لسانيات جي قريب سان تعلق آهي.

روسي زبان جو قومي عمارت

هي عمارت (اين آر آر اي جي مختصر طور تي شامل آهي) هڪ ذيلي ذخيرو شامل آهي جنهن کي مختلف قسم جي ڪمن کي حل ڪرڻ لاء وسيلن استعمال ڪرڻ جي اجازت ڏني وئي آهي.

اين آر آر اين جي بنياد تي مواد ذيلي تقسيم ٿيل آهن:

  • 90s ۽ 2000 جي ميڊيا ۾ شايع ٿيڻ واريون گهرو ۽ غير ملڪي؛
  • زباني تقرير جي رڪارڊ؛
  • عارضي طور تي نشان لڳل نصوص (يعني نشانين سان دٻاء)؛
  • عبرت جو اظهار؛
  • شاعريء جو ڪم؛
  • مصنوعي نشانن سان گڏ مواد

انفارميشن سسٽم ۾ پڻ سيمڪورس پڻ روسي، جرمن، فرانسيسي ۽ ڪيترين ٻين ٻولين ۾ ڪم جي متوازي ترجمن سان شامل آهن (۽ ان جي باوجود).

ڊيٽابيس ۾ پڻ، هن جي ترقي جي مختلف دورن دوران روسي ۾ لکيل لکڻ جي تاريخ جي تاريخي مضمونن جو هڪ حصو آهي. اتي پڻ تعليمي عمارت آهي، جنهن کي روسي زبان کي ماهر ۾ پرڏيهي شهرين لاء مفيد ثابت ٿي سگهي ٿو.

روسي زبان جو قومي ڪورپس 400 ملين ليڪسڪ يونٽ شامل آهن ۽ ڪيترن ئي احترام ۾، يورپ جي ٻوليء جون عمارتون هڪ اهم حصو آهن.

امڪان

اها حقيقت اها آهي ته روسي يونيورسٽين ۽ گڏوگڏ غير ملڪي يونيورسٽين ۾ ڪورپس جي لسانيات جي ليبارٽريٽس هن جي هدايت کي تسليم ڪرڻ جي حق ۾ هڪ حقيقت آهي. ان سلسلي ۾ ڄاڻ ۽ تلاش جي وسيلن جي حوالي سان اپليڪيشن ۽ تحقيق سان، اعلي ٽيڪنالاجي، سوال جو جواب سسٽم جي فيلڊ ۾ ڪجهه علائقن جي ترقي شامل آهي، پر مٿي ڄاڻايل آهي.

ڪورپس لسانیات کے اضافی ترقی، تمام سطحوں پر پیش گوئی کی جاتی ہے، تخنیک سے، نئی الگورتھم کو متعارف کرانے، معلومات کی تلاش اور پروسیسنگ کے عمل کو بہتر بنانے، کمپیوٹرز کی صلاحیتوں کو بڑھانے، رام میں اضافہ، र रोजमर्राको साथ समाप्ति، जस्तै प्रयोगकर्ताहरू زندگي ۽ ڪم.

نتيجو

گذريل صديء جي وچ ۾ 2017 هڪ پريشان مستقبل هئي، جنهن ۾ خلائي جهازن جي ڪائنات ۽ ڪائنات جي ماڻهن کي ماڻهن لاء ڪم ڪري ٿو. حقيقت ۾، "اڇو اسپيڪر" ۾ سائنسي بنيادون آهن ۽ صدين تائين انسانيت کي ڏکيو آهي سوالن جو جواب ڏيڻ جي خطرناڪ ڪوشش ڪري ٿو. هتي ٻولي جي فعل جو سوال هتي هڪ معزز جڳهه تي قبضو ڪري ٿو، ۽ ڪورپسڪو ۽ ڪمپيوٽر لسانيات اسان کي انهن جي جواب ڏيڻ ۾ مدد ڪري سگهي ٿي.

وڏي ڊيٽا سيٽنگن کي پروسيسنگ توهان کي نمونن کي ڳولڻ جي اجازت ڏئي ٿو جيڪي اڳ ۾ موجود نه آهن، خاص زبان جي خاصيتن جي ترقي جي پيروي ڪن ٿا، حقيقي وقت ۾ لفظن جي ٺهڪي کي مانيٽر ڪري ٿو.

عملي طور تي عالمي سطح تي، ڪور عوام کي جذبي جي تشخيص لاء هڪ امڪاني طريقو سمجهي سگهجي ٿو - انٽرنيٽ حقيقي صارفين پاران پيدا ڪيل مختلف نصوص جو هڪ دائمي ڊيٽابيس آهي: اهي تبصرو، ۽ نظرثاني، مضمونن، ۽ تقريرن جي ٻين ڪيترن ئي قسمن جو ذڪر.

ان کان سواء، ڪورز سان ڪم هڪ ئي ٽيڪنالاجي ذريعن جي ترقي ۾ مدد ڪري ٿو جيڪا معلومات جي ڳولا ۾ حصو وٺي، جيڪا گوگل يا Yandex خدمتن، مشين ترجمي، اليڪٽرانڪ لغات تي اسان کي واقف آهي.

اهو اعتماد سان سمجهي سگهجي ٿو ته ڪورپس لسانيات صرف پهريون مرحلو ٺاهيندي آهي، ۽ ويجهو مستقبل ۾ تيزيء سان ترقي ڪندي.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sd.birmiss.com. Theme powered by WordPress.