2024-09-01
Python
00

生成,造语料,日期的脚本

csharp
import random from datetime import datetime, timedelta def generate_random_date(start_year, end_year): start_date = datetime(start_year, 1, 1) end_date = datetime(end_year, 12, 31) random_days = random.randint(0, (end_date - start_date).days) return start_date + timedelta(days=random_days) def generate_fake_data(num_samples): fake_data = [] for _ in range(num_samples): start_date = generate_random_date(2010, 2050) # 半年后的日期 end_date = start_date + timedelta(days=6 * 30) date_format = "%Y年%m月%d日" sample = f"{start_date.strftime(date_format)}至{end_date.strftime(date_format)}" fake_data.append(sample) return fake_data def save_to_txt(fake_data, file_name="fake_data.txt"): with open(file_name, "w", encoding="utf-8") as file: for line in fake_data: file.write(line + "\n") if __name__ == "__main__": num_samples = 2000 # 你需要的语料数量 fake_data = generate_fake_data(num_samples) save_to_txt(fake_data) print(f"生成了 {num_samples} 条语料并保存到 fake_data.txt 文件中。")

造出来是这样:

csharp
20380530日至2038112620430302日至2043082920191030日至2020042720180908日至2019030720270322日至2027091820210629日至2021122620301027日至2031042520410129日至2041072820230610日至2023120720491207日至2050060520320328日至2032092420120917日至2013031620410209日至20410808
如果对你有用的话,可以打赏哦
打赏
ali pay
wechat pay

本文作者:Dong

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!