什麼是 TOC 的基本概念?


下面解釋了理論計算機科學 (TOC) 中基本概念的基本定義以及相關示例:

符號

符號簡單地稱為字元。

它是一個原子單元,例如數字、字元、小寫字母等。有時它也是一個單詞。形式語言不涉及符號的“含義”。

例如:

  • a,b,c,……………z
  • 0,1,2,…………..9
  • +,-,*,%,…………特殊字元。

字母表

字元集稱為字母表。

字母表是有限的、非空的符號集。用 Σ 或 E 表示。

例如:

  • Σ ={0,1} 二進位制字母表集。
  • Σ ={a,b,c,……..,z} 所有小寫字母的集合。
  • Σ ={A,B,C,………Z} 所有大寫字母的集合。
  • Σ ={+,&,%,……….} 所有特殊字元的集合。

字串或單詞

字串是從某個字母表中選擇的一系列有限符號。

例如:

  • 00011001 是來自二進位制字母表 Σ={0,1} 的字串,而 aabbcabcd 是來自字母表 Σ={a,b,c,d} 的字串。
  • 如果,w = 0110 y = 0aa x = aabcaa z = 111,則:
    • 特殊字串 − s(也用 X 表示)
    • 連線 − wz = 0110111
    • 長度 − |w| = 4 |s| = 0 |x| = 6
    • 反轉 − yR = aa0

一些特殊的字串集如下:

  • E* E 中所有符號的字串
  • E+ E* - {s}

例如:

  • E = {0, 1}
  • E* = {s, 0, 1, 00, 01, 10, 11, 000, 001,...}
  • E+ = {0, 1, 00, 01, 10, 11, 000, 001,.}

字串長度

它是字串或單詞中符號的數量。用 |w| 表示。

例如:

  • w=01011001 來自二進位制字母表 Σ={0,1}

    |w| = 8

  • X= abbaddabba 來自二進位制字母表 Σ={a,b}

    |X| = 10

語言

語言是從某個字母表(有限或無限)中選擇的一組字串。換句話說,E* 的任何子集 L 都是 TOC 中的語言。

一些特殊的語言如下:

  • {} 空集/語言,不包含任何字串。
  • {s} 包含一個字串(空字串)的語言。

示例

  • E = {0, 1}

    L = {x | x 屬於 E* 且 x 包含偶數個 0}

  • E = {0, 1, 2,., 9, .}

    L = {x | x 屬於 E* 且 x 構成一個有限長度的實數}

    = {0, 1.5, 9.326,.}

  • E = {a, b, c,., z, A, B,., Z}

    L = {x | x 屬於 E* 且 x 是 Pascal 保留字}

    = {BEGIN, END, IF,...}

  • E = {Pascal 保留字} U { (, ), ., :, ;,...} U {合法的 Pascal 識別符號}

    L = {x | x 屬於 E* 且 x 是語法上正確的 Pascal 程式}

  • E = {英語單詞}

    L = {x | x 屬於 E* 且 x 是語法上正確的英語句子}

更新於: 2021 年 6 月 11 日

9K+ 瀏覽量

啟動您的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.