生成,造语料,日期的脚本
csharpimport random
from datetime import datetime, timedelta
def generate_random_date(start_year, end_year):
start_date = datetime(start_year, 1, 1)
end_date = datetime(end_year, 12, 31)
random_days = random.randint(0, (end_date - start_date).days)
return start_date + timedelta(days=random_days)
def generate_fake_data(num_samples):
fake_data = []
for _ in range(num_samples):
start_date = generate_random_date(2010, 2050)
# 半年后的日期
end_date = start_date + timedelta(days=6 * 30)
date_format = "%Y年%m月%d日"
sample = f"{start_date.strftime(date_format)}至{end_date.strftime(date_format)}"
fake_data.append(sample)
return fake_data
def save_to_txt(fake_data, file_name="fake_data.txt"):
with open(file_name, "w", encoding="utf-8") as file:
for line in fake_data:
file.write(line + "\n")
if __name__ == "__main__":
num_samples = 2000 # 你需要的语料数量
fake_data = generate_fake_data(num_samples)
save_to_txt(fake_data)
print(f"生成了 {num_samples} 条语料并保存到 fake_data.txt 文件中。")
造出来是这样:
csharp2038年05月30日至2038年11月26日
2043年03月02日至2043年08月29日
2019年10月30日至2020年04月27日
2018年09月08日至2019年03月07日
2027年03月22日至2027年09月18日
2021年06月29日至2021年12月26日
2030年10月27日至2031年04月25日
2041年01月29日至2041年07月28日
2023年06月10日至2023年12月07日
2049年12月07日至2050年06月05日
2032年03月28日至2032年09月24日
2012年09月17日至2013年03月16日
2041年02月09日至2041年08月08日
本文作者:Dong
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!