]> marstr Code Repo - 124thAWS/commitdiff
Initial commit with script
authorMarStr <marcus@marstr.online>
Wed, 10 Jul 2024 15:04:10 +0000 (17:04 +0200)
committerMarStr <marcus@marstr.online>
Wed, 10 Jul 2024 15:04:10 +0000 (17:04 +0200)
124thAWS.py [new file with mode: 0644]
repoinfo [new file with mode: 0644]

diff --git a/124thAWS.py b/124thAWS.py
new file mode 100644 (file)
index 0000000..12e647c
--- /dev/null
@@ -0,0 +1,179 @@
+\r
+import boto3        # pip install boto3\r
+import pygame       # pip install pygame\r
+import time\r
+import io\r
+import random\r
+import os\r
+\r
+# -------------------------------------------------------------------\r
+# Enter your access data and your AWS region\r
+# -------------------------------------------------------------------\r
+atc_aws_key    = "YOUR_AWS_KEY"\r
+atc_aws_secret = "YOUR_AWS_SECRET"\r
+atc_aws_region = "SERVER REGION"\r
+# -------------------------------------------------------------------\r
+\r
+# -------------------------------------------------------------------\r
+# Do you want to see ATC messages in the console also?\r
+# -------------------------------------------------------------------\r
+atc_show_responses = True\r
+\r
+# -------------------------------------------------------------------\r
+# The voice model you want to use.\r
+#\r
+# IMPORTANT:\r
+# Depending on the model you want, the prices are per 1m characters\r
+# generated vary *drastically*.\r
+# 'standard' is the cheapest, 'neural' the most expensive one.\r
+# Depending on the model you pick, the list of voices vary also.\r
+#\r
+# Pricing: https://aws.amazon.com/polly/pricing/\r
+# -------------------------------------------------------------------\r
+atc_aws_voicemodel = 'standard'\r
+# atc_aws_voicemodel = 'neural'\r
+\r
+\r
+# -------------------------------------------------------------------\r
+# Define where your X-Plane log file is located\r
+# This usually sits in the root of your X-Plane folder, named Log.txt\r
+# -------------------------------------------------------------------\r
+atc_xplane_log = "M:\\Flight Sim\\Simulator\\12\\Log.txt"\r
+#atc_xplane_log = "C:\\Users\\windo\\Desktop\\Log.txt"\r
+\r
+# -------------------------------------------------------------------\r
+# Put in your call sign. Must be the same you entered in 124th ATC\r
+# -------------------------------------------------------------------\r
+atc_callsign = "MST 6012"\r
+\r
+\r
+# -------------------------------------------------------------------\r
+# Do you want to hear "your voice" when contacting ATC?\r
+# -------------------------------------------------------------------\r
+atc_captain_voice = True\r
+\r
+# -------------------------------------------------------------------\r
+# Select your pilot's voice\r
+# Ideally you will need to remove your selected voice from the array\r
+# of available Polly voices below, so that it does not come up as\r
+# your ATC voice\r
+# -------------------------------------------------------------------\r
+atc_pilot_voice = 12\r
+\r
+\r
+# -------------------------------------------------------------------\r
+# NO TRESPASSING BEYOND THIS POINT\r
+# -------------------------------------------------------------------\r
+\r
+os.system("cls")\r
+print("  ")\r
+print(" ---------------------------------------------- ")\r
+print(" 124thAWS")\r
+print(" Making 124thATC sound more natural")\r
+print(" ---------------------------------------------- ")\r
+print(" Developed by MarStrMind")\r
+print(" License: MIT")\r
+print(" ---------------------------------------------- ")\r
+print(" Using file: " + atc_xplane_log)\r
+print(" ---------------------------------------------- ")\r
+print("  ")\r
+\r
+# The voice names available for playback, depending on the model\r
+# Of course, you can remove any that you do not like\r
+# Sources for voice names:\r
+# - https://docs.aws.amazon.com/polly/latest/dg/neural-voices.html\r
+# - https://docs.aws.amazon.com/polly/latest/dg/standard-voices.html\r
+atc_voices = None\r
+if atc_aws_voicemodel == "standard":\r
+    atc_voices = ["Nicole", "Russell", "Amy", "Emma", "Brian", "Aditi", "Raveena", "Joanna", "Kendra", "Kimberly", "Salli", "Joey", "Geraint"]\r
+    # After testing, I removed Ivy from this list. It sounded too child-like.\r
+if atc_aws_voicemodel == "neural":\r
+    atc_voices = ["Olivia", "Amy", "Emma", "Brian", "Arthur", "Kajal", "Niamh", "Aria", "Ayanda", "Danielle", "Gregory", "Ivy", "Joanna", "Kendra", "Kimberly", "Salli", "Joey", "Matthew", "Ruth", "Stephen"]\r
+    # Missing in this list are Justin and Kevin -\r
+    # they are declared as being young child voices - you normally do not hear children on an ATC transmission.\r
+\r
+\r
+# Setup our Polly session to AWS\r
+atc_polly_client = boto3.Session(\r
+                aws_access_key_id=atc_aws_key,                     \r
+                aws_secret_access_key=atc_aws_secret,\r
+                region_name=atc_aws_region).client('polly')\r
+\r
+# Last read line\r
+atc_last_line = -1\r
+\r
+# Init pygame and its mixer\r
+pygame.init()\r
+pygame.mixer.init()\r
+\r
+# Open file before main loop\r
+atc_log = open(atc_xplane_log)\r
+\r
+# Who spoke last - pilot or ATC\r
+atc_wsl = 1 # 1: pilot, 2: ATC. Initially set to 1\r
+\r
+# Main run loop\r
+while True:\r
+    atc_lines = atc_log.readlines()\r
+    idx = 0\r
+    for line in atc_lines:\r
+        if "Communication:" in line:\r
+            content = line.split()\r
+            c_idx = 0\r
+            for word in content:\r
+                if word == "Communication:":\r
+                    c_idx = c_idx+1\r
+                    break\r
+                c_idx = c_idx + 1\r
+            \r
+            new_l_el = 0\r
+            newline = ""\r
+            for word in content:\r
+                if new_l_el >= c_idx+1:\r
+                    newline = newline + " " + word\r
+                new_l_el = new_l_el + 1\r
+\r
+            if idx > atc_last_line:\r
+                # Update last read line\r
+                atc_last_line = idx\r
+\r
+                # Pick a voice - depending on current situation\r
+                resp = ""\r
+                voice_to_use = -1\r
+                if content[c_idx+1] == atc_callsign:\r
+                    vc = random.randrange(len(atc_voices))\r
+                    if vc == atc_pilot_voice:\r
+                        vc = vc-1\r
+                        if vc == -1:\r
+                            vc = 1\r
+                    voice_to_use = vc\r
+                    resp = "ATC"\r
+                    atc_wsl = 2\r
+                else:\r
+                    voice_to_use = atc_pilot_voice\r
+                    resp = "Pilot"\r
+                    atc_wsl = 1\r
+\r
+                # Show what has been said so that it can be verified outside of Pilot2ATC - if the user wants it\r
+                if atc_show_responses == True:\r
+                    print(" > " + resp + " - [" + atc_voices[voice_to_use] + "]: " + newline)\r
+\r
+                # Generate voice!\r
+                # Let's keep it at OGG - best compromize between data transfer size and quality\r
+                response = atc_polly_client.synthesize_speech(VoiceId=atc_voices[voice_to_use], OutputFormat='ogg_vorbis', Text = newline, Engine = atc_aws_voicemodel)\r
+                # And place that into a binary block\r
+                data = io.BytesIO(response['AudioStream'].read())\r
+\r
+                # Place the data into pygame and play it\r
+                pygame.mixer.music.load(data)\r
+                if resp == "ATC":\r
+                    pygame.mixer.music.play()\r
+                if resp == "Pilot" and atc_captain_voice == True:\r
+                    pygame.mixer.music.play()\r
+                pygame.event.wait()\r
+        \r
+        # Increase loop count\r
+        idx = idx + 1\r
+\r
+    atc_log.seek(0)\r
+    time.sleep(3)
\ No newline at end of file
diff --git a/repoinfo b/repoinfo
new file mode 100644 (file)
index 0000000..52ab853
--- /dev/null
+++ b/repoinfo
@@ -0,0 +1,134 @@
+[section]124thAWS[/section]\r
+\r
+A Python script allowing to use standard or neural voices of Amazon Polly, in 124thATC. It does so by monitoring 124thATC's output and leveraging Amazon's Polly technology, to generate voice responses that sound more natural.\r
+\r
+The voices that 124thATC can use are those that are available on your system, on Windows this set is usually extremely limited. On top of that, they sound very robotic. Not what you'd want when talking to ATC in a flight. While there are solutions available that leverage AI (custom versions of ChatGPT), the costs are - in my opinion - too high. SayIntentions is my prime example. Clocking in at 30 Dollars per month (at the time of this writing), it is deemed not feasible for most.\r
+\r
+I did have a look at ChatGPT itself for ATC, and other available tools. I came to the conclusion that 124thATC is one of the best currently available (for offline use).\r
+\r
+Through this Python script, you can make 124thATC sound more natural, providing better overall immersion.\r
+\r
+Note: this works fine on Windows. Linux and Mac are untested - but I see no reason why it should not work on those two systems. It is Python after all.\r
+\r
+\r
+[section]Not entirely free![/section]\r
+\r
+[b]IMPORTANT:[/b] Using this approach may end up not being free. You have a free allowance of 1 million characters per month, no matter which model you choose. But after that, using the service will incur costs. How high the costs are, depends on 1) the amount of ATC calls you make. More calls = more characters. And 2) the selected model. Neural voices are much more natural, but they also require more power to generate - hence the higher costs.\r
+\r
+To find out what is best for you, have a look at these pages first:\r
+- Amazon Polly Pricing [link]https://aws.amazon.com/polly/pricing/[/link]\r
+- AWS Polly Cost Calculator [link]https://calculator.aws/#/createCalculator/polly[/link]\r
+\r
+For example -\r
+\r
+If you make 100 ATC calls per day, which have 150 characters on average, you would end up with: 3,000 calls per month, with 450,000 characters in total. Standard Text-to-Speech (monthly): [b]1.80 USD[/b] (again, the standard voice model). \r
+\r
+However - I find AWS the best compromise between quality and cost. This is much better than 30 USD per month for SayIntentions.\r
+\r
+\r
+[section]Preparation[/section]\r
+\r
+Needless to say, you will need an AWS account. If you do not have one, you will need to get one now. The account itself is free. Go here to create one: [link]https://portal.aws.amazon.com/gp/aws/developer/registration/index.html?nc2=h_ct&src=header_signup[/link]\r
+\r
+Then, you will need to provide payment information, in my case it was a credit card. While you will not be charged if you stay within the free allowance, you will be charged if you exceed them. In our case with ATC responses it should, however, not break your bank.\r
+\r
+Once this is done you will basically have access to AWS services. You can now log in with your specified email and password as the root user which has access to the AWS console.\r
+\r
+Inside the console, go the top right (your name), click on it, and choose Security Credentials.\r
+\r
+In the middle you will find the section [b]Access Keys[/b]. Click on [i]Create Access Key[/i] and **WRITE DOWN** the key and secret somewhere, as it will not be shown again. You will also have the option to download a CSV with the credentials - you can do that too and save it to a safe and private location.\r
+\r
+If you want to use AWS and its services elsewhere, you are of course free to install the AWS CLI tools. But for this script, it is not necessary.\r
+\r
+\r
+[section]Setup[/section]\r
+\r
+You will need two Python modules: boto3 and pygame. Install them like so:\r
+\r
+[code]pip install boto3\r
+pip install pygame[/code]\r
+\r
+Next, open up the 124thAWS.py script with your favorite editor and make the necessary adjustments as follows:\r
+\r
+[code]# -------------------------------------------------------------------\r
+# Enter your access data and your AWS region\r
+# -------------------------------------------------------------------\r
+atc_aws_key    = "YOUR_AWS_KEY"\r
+atc_aws_secret = "YOUR_AWS_SECRET"\r
+atc_aws_region = "SERVER REGION"[/code]\r
+\r
+The first two are self-explanatory. These are the key and secret you have acquired in the previous step.\r
+\r
+Most regions have access to Polly - selecting the correct region will accelerate the data transfer of audio data from AWS to your machine. Go to this [link]https://www.aws-services.info/polly.html[/link] and choose your region. For me that is eu-central-1.\r
+\r
+If you want the script to show which voice it has selected and what the response is, you can change\r
+\r
+[code]atc_show_responses = True[/code]\r
+\r
+to True. Default is True. Setting this to False disables this display per line spoken.\r
+\r
+Next, you need to select your voice model. Default is standard.\r
+\r
+[code]atc_aws_voicemodel = 'standard'[/code]\r
+\r
+Change this to 'neural' if you want to use the more sophisticated voice generation model. Again, keep in mind that this model is more expensive and can incur significantly higher costs should you exceed the free limits.\r
+\r
+The next section defines where the text log of X-Plane is located. Typically this sits in the root of your X-Plane installation folder.\r
+\r
+[code]atc_xplane_log = "M:\\Flight Sim\\Simulator\\12\\Log.txt"[/code]\r
+\r
+This is a default example I left in - you need to find the path of your file. This can also be on a network drive - important is that the Python script can access this location. Notice the double backslashes for the folder delimiters.\r
+\r
+You will now need to enter your call sign. In 124thATC when you file a flight plan, you will be asked to provide a flight number which has two fields. What you enter here is your call sign.\r
+\r
+In my case, I use "MST" on the left, and "6012" on the right. The resulting callsign will be a string made up of those two with a space. For me this is \r
+\r
+[code]MST 6012[/code]\r
+\r
+This is what you will need to enter at the line\r
+\r
+[code]atc_callsign = "MST 6012"[/code]\r
+\r
+Replace this with your callsign.\r
+\r
+Next, decide whether or not you want a voice for readbacks and/or communication from the cockpit to be played as audio. If you set this to False, only ATC communication will be audible.\r
+\r
+[code]atc_captain_voice = True[/code]\r
+\r
+If you set the previous setting to false, you can skip the paragraph.\r
+\r
+If you did set it to true however, you will need to determine which voice your captain shall have. It is a number from the array of Polly voices further down in the script. Count the position of the voice, then subtract 1 from that number. For example if voice #13 (Geraint) is the one you want, you put in 12 as the number at this variable. This voice will not be used for ATC communications.\r
+\r
+[code]atc_pilot_voice = 12[/code]\r
+\r
+\r
+[b]Turn off Windows/TTS voices from 124thATC[/b]\r
+\r
+Open the Options window, should you have closed it already. There, disable the option "Activate Speech Output" under "Radio" in the bottom left.\r
+\r
+\r
+[section]Finally: RUNNING[/section]\r
+\r
+Once you have done all the above steps, open a command prompt and navigate to where the script is located. Then, simply run\r
+\r
+[code]python .\124thAWS.py[/code]\r
+\r
+You will be greeted with a small message, and the script begins to work immediately. Meaning it intercepts ATC messages it will find in the text file. Once an "update" is detected, the voice is generated and played.\r
+\r
+The script can be on any machine you want - important is that the script has access to the text file 124thATC generates.\r
+\r
+\r
+[section]Detailed configuration[/section]\r
+\r
+You can remove voices from each array you absolutely do not like. In this case, remove them, and adjust your number for the captain voice if you want this enabled.\r
+\r
+The script waits 3 seconds before it enters its next processing loop. You can change the number in the last value to something else - however: a lower value performs loops in shorter intervals, but is also more resource-intensive. A higher value is less resource-intensive, but provides slower voice updates.\r
+\r
+I find 3 seconds to be a good balance.\r
+\r
+The sound format is OGG Vorbis. I would recommend you to leave it at that. It is the best compromise between quality and data transfer size.\r
+\r
+\r
+[section]Future plans[/section]\r
+\r
+I may need to figure out how to efficiently read X-Plane's dataref values so that I can further enhance realism. For example only pick another voice if you left a certain area or changed the type of contact. I will be looking into this at some time - for now I am happy with how this has turned out.\r