Update README.md
Browse files
README.md
CHANGED
|
@@ -14,6 +14,9 @@ pipeline_tag: question-answering
|
|
| 14 |
Pretraining Model: [wangchanberta-base-att-spm-uncased](https://huggingface.co/airesearch/wangchanberta-base-att-spm-uncased).
|
| 15 |
|
| 16 |
This is the wangchanberta-base-att-spm-uncased model, fine-tuned using the thaiqa_squad dataset.
|
|
|
|
|
|
|
|
|
|
| 17 |
## Data cleaning
|
| 18 |
Remove HTML tags using BeautifulSoup and remove punctuation using string.punctuation.
|
| 19 |
```python
|
|
@@ -32,6 +35,4 @@ no_punct = [char for char in example if char not in punct]
|
|
| 32 |
example = ''.join(no_punct)
|
| 33 |
print(example)
|
| 34 |
#"ลูนา 1 ลูนา 1 อี1 ซีรีส์ ซึ่งในขณะนั้นรู้จักกันในชื่อ เมชตา ความฝัน เป็นยานอวกาศลำแรกที่เดินทางไปถึงบริเวณใกล้เคียงของดวงจันทร์ และเป็นยานอวกาศลำแรกในโครงการลูนาของโซเวียตที่สามารถปล่อยขึ้นไปในทิศทางเดียวกับดวงจันทร์ได้สำเร็จ"
|
| 35 |
-
```
|
| 36 |
-
|
| 37 |
-
https://github.com/tommyA8/wangchanBERTa-fined-tune-thaiqa_squad
|
|
|
|
| 14 |
Pretraining Model: [wangchanberta-base-att-spm-uncased](https://huggingface.co/airesearch/wangchanberta-base-att-spm-uncased).
|
| 15 |
|
| 16 |
This is the wangchanberta-base-att-spm-uncased model, fine-tuned using the thaiqa_squad dataset.
|
| 17 |
+
|
| 18 |
+
# Souce code
|
| 19 |
+
https://github.com/tommyA8/wangchanBERTa-fined-tune-thaiqa_squad
|
| 20 |
## Data cleaning
|
| 21 |
Remove HTML tags using BeautifulSoup and remove punctuation using string.punctuation.
|
| 22 |
```python
|
|
|
|
| 35 |
example = ''.join(no_punct)
|
| 36 |
print(example)
|
| 37 |
#"ลูนา 1 ลูนา 1 อี1 ซีรีส์ ซึ่งในขณะนั้นรู้จักกันในชื่อ เมชตา ความฝัน เป็นยานอวกาศลำแรกที่เดินทางไปถึงบริเวณใกล้เคียงของดวงจันทร์ และเป็นยานอวกาศลำแรกในโครงการลูนาของโซเวียตที่สามารถปล่อยขึ้นไปในทิศทางเดียวกับดวงจันทร์ได้สำเร็จ"
|
| 38 |
+
```
|
|
|
|
|
|