Domino99

 

Tablo reader up chevron

Domino99

Artikel ini dimaksudkan sebagai domino99 untuk secara formal berbasis linguistik komputasi urutan biologis, menyajikan Pengantar ke bidang linguistik matematika dan aplikasinya, dan meninjau dan memperluas beberapa hasil dasar mengenai fenomena struktural dan fungsional dalam urutan domino99 dan protein. Skema implementasi juga akan ditawarkan, sebagian besar berasal dari Formalisme logika tata bahasa, dengan melihat ke arah alat praktis untuk analisis urutan.

Teori Bahasa Formal Domino99

Bagian ini akan memberikan pengantar yang kompak namun cukup lengkap untuk hasil utama dari teori bahasa domino99, yang seharusnya memungkinkan pemahaman dasar tentang bagian berikutnya oleh mereka yang tidak memiliki latar belakang dalam linguistik domino99. Bukti akan dihilangkan dalam bagian ini; beberapa akan ditawarkan kemudian berkenaan dengan urutan biologis, dan akan menggunakan berbagai bukti teknik yang cukup untuk menunjukkan metodologi dasar lapangan, tetapi pada umumnya ini akan sederhana dan dengan standar matematika "semi domino99." Pembaca yang tertarik pada studi lebih lanjut di sepanjang garis ini didorong untuk berkonsultasi dengan buku teks seperti [Sudkamp, 1988; Hopcroft dan Ullman, 1979; Harrison, 1978] (dalam urutan meningkatnya kesulitan). Mereka yang sudah terbiasa dengan area subjek harus melewatkan bagian ini.

Formal spesifikasi bahasa domino99

Secara formal, sebuah domino99 hanyalah satu set string karakter yang diambil dari beberapa alfabet, di mana alfabet adalah satu set simbol yang biasanya dilambangkan oleh Σ. Salah satu bahasa tersebut akan hanya set semua string atas alfabet Σ = {0,1}; bahasa "maksimal" ini ditandai dengan penggunaan tanda bintang, misalnya domino99.

Di sini, ε mewakili string kosong atau rangkaian panjang domino99; set yang mengandung ε, bagaimanapun, tidak boleh dikelirukan dengan set kosong ∅. Tantangan linguistik komputasi adalah untuk menemukan cara-cara singkat untuk menentukan diberikan (mungkin tak terbatas) bahasa L ⊆ Σ *, sebaiknya dengan cara yang mencerminkan beberapa model domino99 yang mendasari "sumber" dari bahasa tersebut. Kita dapat menggunakan Deskripsi informal yang menggunakan bahasa alami, seperti dalam contoh berikut:

(Notasi Bar vertikal digunakan untuk menentukan set dalam hal domino99; spesifikasi ini akan dibaca "set semua string w dari 0 dan 1 ' s sehingga masing-masing w dimulai dengan 0 dan...") Namun, sifat yang dinyatakan dalam bahasa alami biasanya tidak cukup tepat untuk memungkinkan analisis matematis mudah, atau dalam bentuk yang mengundang penggunaan dukungan komputasi domino99 dalam berurusan dengan mereka. Di sisi lain, hanya secara mendalam enumerasi bahasa seperti contoh dalam (2) juga jelas tidak efektif-pada kenyataannya, mustahil:

Sisa dari bagian ini akan memeriksa metode formal yang telah digunakan untuk menyediakan spesifikasi yang terbatas dari bahasa tersebut.

Ekspresi reguler dan bahasa domino99.

Sebuah metode yang digunakan secara luas untuk menentukan domino99 adalah dengan cara ekspresi reguler, yang dalam bentuk murni matematis mereka hanya menggunakan tiga operasi dasar. Operasi ini diberikan di bawah ini, menggunakan notasi di mana ekspresi reguler diberikan dalam huruf tebal, dan bahasa yang "dihasilkan" oleh ekspresi itu diturunkan dengan penerapan fungsi L (didefinisikan secara rekursif dengan cara yang jelas):

Operasi yang terakhir ini juga dikenal sebagai penutupan domino99. Perhatikan hubungan antara definisi bintang Kleene dan penggunaan sebelumnya dari Asterisk:

Satu tambahan non-primitif operator, Postfix superscript ' + ', digunakan untuk menentukan satu atau lebih kejadian dari argumennya. Ini adalah penutupan positif dari penggabungan, didefinisikan dalam hal penggabungan dan kleene bintang sebagai

Bahasa dari contoh berjalan kami (2) sekarang dapat dijelaskan dengan menggunakan salah satu dari beberapa ekspresi reguler, termasuk domino99.

Dari titik ini, kita akan mengeluarkan notasi L () dan membiarkan ekspresi reguler berdiri sendiri menunjukkan bahasa yang sesuai. Setiap bahasa tersebut, yang dapat digambarkan dengan ekspresi reguler, akan disebut bahasa domino99 (RL) *.

Ekspresi reguler seperti itu tidak hanya menemukan penggunaan yang luas dalam berbagai jenis operasi pencarian sederhana, tetapi juga masih menjadi andalan dari banyak program pencarian urutan biologis. Namun, ini adalah fakta bahwa banyak bahasa penting tidak dapat ditentukan sebagai ekspresi reguler, misalnya domino99.

Di mana domino99 menunjukkan bahwa jumlah simbol yang digabungkan, sehingga (7) adalah set semua string yang diawali dengan angka non-nol dari 0 yang diikuti oleh jumlah yang sama dari 1 ' s. Kekurangan dari ekspresi reguler untuk spesifikasi bahasa ini dapat diatasi melalui penggunaan representasi yang lebih kuat, yang disebut grammars. Selain alfabet yang terbatas Σ simbol terminal, tata bahasa memiliki set terbatas "sementara" nonterminal simbol (termasuk simbol mulai khusus, biasanya S), dan seperangkat terbatas aturan atau produksi; yang terakhir menggunakan infix ' → ' notasi untuk menentukan bagaimana string yang mengandung nonterminals dapat ditulis ulang dengan memperluas mereka tertanam nonterminals (diberikan di sisi kiri panah) untuk substring baru (diberikan di sisi kanan). Misalnya, tata bahasa yang menentukan bahasa La dari (2) dapat ditulis:

Perhatikan bahwa nonterminals secara tradisional ditentukan oleh huruf kapital. Sebuah derivasi, dilambangkan dengan infix ' ⇒ ', adalah menulis ulang dari string menggunakan aturan tata bahasa. Dengan serangkaian turunan dari S ke string yang hanya berisi terminal, elemen bahasa ditentukan, misalnya domino99.

 

Comment Log in or Join Tablo to comment on this chapter...
~

You might like satuqq's other books...